搜索: "生成任务"

共找到 3 篇相关文章

TDM-R1模型强势崛起，性能超越GPT-4，GenEval评分飙升至92%

TDM-R1 是一项针对少步扩散模型的创新后训练方法，它显著提升了这些模型在组合式生成任务上的表现能力。研究团队利用 GenEval 基准测试验证了这项工作的有效性，并取得了令人瞩目的结果。该研究以4步基线模型（TDM-SD3.5-M）作为起点，在此基础上通过引入 TDM-R1 方法，将GenEval得分从61%大幅提升到92%，展示出了在组合式生成任务上的巨大进步。与此同时，与标准80步的SD3

科技2026/4/102 阅读

中科院团队研发SparseRL技术：实现深度强化学习自动优化CUDA代码性能

如何让人工智能不仅能够生成可执行的代码，还能优化代码的运行效率？这个问题长期以来一直困扰着研究者。最近，中国科学院计算技术研究所的一个团队提出了名为 SparseRL 的新框架，首次将深度强化学习应用于稀疏 CUDA 代码的生成任务中。简单来说，就是让 AI 学会根据稀疏矩阵的具体结构，自动生成最优化的 CUDA 实现代码。实验数据表明，在经典的 SpMV 任务上，该方法将编译成功率提高了 20%

科技2026/3/266 阅读

商汤革新多模态技术：摒弃传统VE与VAE架构中的中间编码器

多模态大模型的研发方式正在经历全面革新。今天，商汤科技与南洋理工大学共同发布了最新技术成果NEO-unify。这是一个实现了“原生、统一、端到端”的多模态架构，其最突出的创新在于：彻底摒弃了传统的视觉编码器（VE）和变分自编码器（VAE）。不再依赖组件拼凑来完成感知与生成任务，而是直接以近乎无损的形式处理像素和文字。通过独特的混合变换器（Mixture-of-Transformer, Mo

AI2026/3/825 阅读