
TDM-R1模型强势崛起,性能超越GPT-4,GenEval评分飙升至92%
TDM-R1 是一项针对少步扩散模型的创新后训练方法,它显著提升了这些模型在组合式生成任务上的表现能力。研究团队利用 GenEval 基准测试验证了这项工作的有效性,并取得了令人瞩目的结果。该研究以4步基线模型(TDM-SD3.5-M)作为起点,在此基础上通过引入 TDM-R1 方法,将GenEval得分从61%大幅提升到92%,展示出了在组合式生成任务上的巨大进步。与此同时,与标准80步的SD3
科技2 阅读
共找到 3 篇相关文章

TDM-R1 是一项针对少步扩散模型的创新后训练方法,它显著提升了这些模型在组合式生成任务上的表现能力。研究团队利用 GenEval 基准测试验证了这项工作的有效性,并取得了令人瞩目的结果。该研究以4步基线模型(TDM-SD3.5-M)作为起点,在此基础上通过引入 TDM-R1 方法,将GenEval得分从61%大幅提升到92%,展示出了在组合式生成任务上的巨大进步。与此同时,与标准80步的SD3

如何让人工智能不仅能够生成可执行的代码,还能优化代码的运行效率?这个问题长期以来一直困扰着研究者。最近,中国科学院计算技术研究所的一个团队提出了名为 SparseRL 的新框架,首次将深度强化学习应用于稀疏 CUDA 代码的生成任务中。简单来说,就是让 AI 学会根据稀疏矩阵的具体结构,自动生成最优化的 CUDA 实现代码。实验数据表明,在经典的 SpMV 任务上,该方法将编译成功率提高了 20%

多模态大模型的研发方式正在经历全面革新。 今天,商汤科技与南洋理工大学共同发布了最新技术成果NEO-unify。 这是一个实现了“原生、统一、端到端”的多模态架构,其最突出的创新在于: 彻底摒弃了传统的视觉编码器(VE)和变分自编码器(VAE)。不再依赖组件拼凑来完成感知与生成任务,而是直接以近乎无损的形式处理像素和文字。 通过独特的混合变换器(Mixture-of-Transformer, Mo