昨日,智能纪元 AGI 报道称,前 DeepSeek 研究员、现任小米 MiMo 大模型项目负责人的罗福莉博士发布了一篇重要论文,该论文与北京大学合作开发了一种名为 ARL-Tangram 的统一资源管理系统。

ARL-Tangram 采用了一种统一的动作级公式和灵活的调度算法,能够在满足不同硬件资源限制的同时,最大限度地减少动作完成时间,并实现定制化的异构资源管理。
在实际的智能体强化学习任务中,ARL-Tangram 显示出了显著的优势,平均动作完成时间提高了 4.3 分,训练步骤的持续时间最多缩短了 1.5 倍,同时节省了高达 71.2% 的外部资源。
罗福莉博士此次发表的论文是她在小米的第二篇突破性成果。去年 10 月,她与北京大学合作发布了另一篇关于混合专家模型和强化学习的论文,这是她在小米的第一篇论文。
在 2025 年的小米人车家全生态合作伙伴大会期间,罗福莉博士首次公开亮相。她在个人社交平台宣布加入小米的 MiMo 大模型团队。
智能技术最终会从语言领域扩展到物理世界。我所在的 Xiaomi MiMo 团队由一群才华横溢且充满激情的研究员组成,我们正努力构建这样一个未来,向着理想的 AGI 目标不断前进。

