小米MiMo团队近期成为网络热议的话题,几乎被“北大学子”所主导。
核心成员高度同源
小米MiMo团队的日常运营中,对于每天对话次数少于100次的员工,会建议其离职。
小米MiMo团队的热度持续上升,人们开始更多地关注这个团队本身,而不仅仅是他们的产品。
与此同时,Meta超级智能实验室近期发布的模型却未能达到预期,多次跳票。
这让许多人对小米MiMo团队产生了浓厚的兴趣,想要了解这支团队背后的故事。
虽然大模型开发通常需要集团军作战,但小米的LLM团队却显得异常神秘。
经过分析,团队核心成员大多拥有北京大学的学术背景,其中不乏罗福莉的师弟。
北京大学也是罗福莉前雇主DeepSeek公司的发源地。
小米MiMo团队通过频繁的产品更新和论文发布,吸引了外界的广泛关注。
随着研究结果的不断曝光,团队核心成员也逐渐为人们所熟知。
肖邦骏,北京大学毕业的博士,专注于边缘计算和联邦学习的研究。
Bingquan Xia,中科院计算技术研究所的研究生,是MiMo-V2-Flash的核心开发者之一。
马文晗,由穗志方教授指导的北京大学计算机科学学院博士生,专攻大语言模型。
穗志方教授不仅是罗福莉的导师,也是马文晗的同门师弟。
朱大为,北京大学计算机科学学院三年级博士生,研究方向为长上下文建模。
关于小米MiMo团队
他参与的《paperbanana》项目引起了广泛关注,并受到量子位的关注。
董谨豪,中国人民大学信息学院讲师,是小米大语言模型核心团队的技术顾问。
他主导建立了人大发–小米基础大语言模型联合重点实验室,并担任技术委员会成员。
张海林,专注于AI基础设施建设,为MiMo系列模型打造高效的强化学习基础设施。
他2025年获得北京大学计算机科学博士学位,导师为崔斌教授,并获北京大学优秀博士论文奖。
除了上述核心成员,还有许多其他成员同样具有深厚的学术背景。
小米MiMo团队之所以能在短时间内取得如此成就,离不开其深厚的北京大学背景。
团队成员的教育背景和小米的产品基因相互结合,形成了独特的技术理念。
△公众号:大信科
这种理念在MiMo模型中得到了充分体现,如7B参数规模、开源策略等。
回顾MiMo的成功之路,我们可以看到多方面因素的共同作用。
而值得一提的是,前阿里通义实验室Qwen大模型负责人林俊旸,是罗福莉的师兄。
两人曾在北京大学从事自然语言处理研究,毕业后又先后加入阿里达摩院。
一个负责Qwen,一个负责MiMo,这两条国内头部模型线的关键人物,有着相似的学术和产业背景。
研究方向为长上下文建模,他认为高效处理超长上下文是未来语言模型和多模态模型的关键能力,也对智能体(Agent)、对齐(Alignment)以及多模态模型的进展感兴趣。
此前,他参与的《paperbanana》项目曾引起较大关注,并被量子位关注。
董谨豪,中国人民大学信息学院/数据工程与知识工程教育部重点实验室讲师,同时也是小米大语言模型(LLM)核心团队技术顾问,主要负责与代码相关的LLM开发,包括预训练、强化学习及智能体方向。
他主导建立了人大发–小米基础大语言模型联合重点实验室,并担任技术委员会成员。
他博士毕业于北京大学计算机科学学院,本科毕业于西安电子科技大学计算机科学与技术专业。
张海林,小米MiMo团队成员,专注于AI基础设施建设,为MiMo系列模型打造高效、可扩展且稳定的强化学习(RL)基础设施。
他2025年获得北京大学计算机科学博士学位,导师为崔斌教授,并曾获北京大学优秀博士论文奖。
研究重点包括大规模大语言模型(LLMs)、深度学习推荐模型(DLRMs)、信息检索(IR)及通用分布式计算。
此外,还有诸多核心作者,但公开信息较少,部分谷歌主页如下:
小米MiMo是一支怎样的团队
一支成立才一两年的团队,能一路冲到顶尖模型研发的前列,靠的绝不只是产品节奏和核心成员这么简单。
仔细梳理团队的背景,我们也会发现一个明显的共性——北大背景浓厚。
从核心成员到技术骨干,很多团队成员本科或博士均来自北京大学计算机学院。
一方面,北大的同门关系、导师体系和院系传承,使得小米在大模型工业界作为后起之秀,能够源源不断地吸纳新鲜血液;
另一方面,学生们也能迅速接触工业界,借助丰富的算力和资源,将科研想法高效落地与迭代。
而在这个过程中,罗福莉则成为团队与北大学术背景之间的重要桥梁。
△图源:北京大学公众号
除了院校对于成员产品理念的影响外,小米MiMo团队的技术理念也深受小米企业产品基因的驱动——
核心就是产品层面的「性价比」和公司一贯的「互联网生态」思维。
放到MiMo模型上,最直观的体现就是7B参数规模、开源策略以及端侧部署方向,也算是清楚地展现了小米的战略布局和生态思路。
所以回过头看,MiMo的成功并非偶然,而是多重因素叠加的结果:
北大科研背景的厚度、核心成员的技术经验,以及小米产品与工程的基因驱动,共同铸就了这支年轻团队的迅速崛起。
对了,还有一个颇有缘分的小细节值得一提——
不久前从阿里离职的通义实验室Qwen大模型负责人林俊旸,正是罗福莉的师兄。
两人硕士阶段均在北京大学语从事自然语言处理相关学习研究,学术路径高度同源。
毕业后又先后加入阿里达摩院,在大模型研发上有着相近的技术底色与行业视野。
一个曾做Qwen,一个带MiMo。
两条国内头部模型线的关键人物,曾经在同一套学术和产业体系中成长出来,这层关系本身也让不少业内人多看了一眼。


梦瑶