搜索: "数据规模"

共找到 3 篇相关文章

中科大与上海AILab揭秘2026年ACL大会上的强化学习后训练规律

中科大与上海AILab揭秘2026年ACL大会上的强化学习后训练规律

从 DeepSeek-R1 到 Kimi K2.5,利用强化学习(RL)来优化大型模型的推理性能已成为关键方法。然而,在 RL 后训练过程中存在一个重要问题:这种训练方式是否遵循特定规律?能否通过给定参数量、计算资源和数据规模,准确预测出 RL 训练所能达到的效果?中国科学技术大学与上海人工智能实验室等机构的研究团队对此进行了系统性的研究。他们使用 Qwen2.5 系列密集模型(从0.5B到72B

科技1 阅读
中美智驾竞赛:何小鹏豪赌下的时间窗口仅剩一年

中美智驾竞赛:何小鹏豪赌下的时间窗口仅剩一年

撰文 | 常 笑设计 | 甄尤美当谈到实现安全无监督自动驾驶所需的数据量时,埃隆·马斯克曾提出需要100亿英里训练数据的观点,这表明行业早已不再仅仅关注算法竞赛,而是一场关于算力和数据规模的较量。根据中国汽车工业协会最新报告,在2025年前十一个月内,全国配备城市NOA功能的乘用车销量达到312.9万辆,占总上险量的15.1%,较2024年全年提升了5.6个百分点。预计到2030年,城市NOA将成

科技5 阅读
华为CLI-Gym:环境互动任务的首个多数据规模扩展方案

华为CLI-Gym:环境互动任务的首个多数据规模扩展方案

面向Terminal-Bench交互任务的数据规模化生产管线首次公开发布!开源了一套完整的自动化数据构建算法构建了1655个高可靠CLI任务环境镜像通过291条轨迹数据实现了20%的解决率提升在Agentic Coding领域,基于SWE-bench的数据管线研究已取得显著进展。过去一年里,业界涌现了许多相关工作,如SWE-Gym、SWE-Smith和R2

科技12 阅读