中国AI领域的研究员们给人留下了亲切、真诚的印象。
艾伦研究所(Ai2)的研究员Nathan Lambert在结束对中国访问后,表达了他对中国的深深感触。
在他看来,这里的LLM社区如同天堂般存在,成员之间相互尊重,即使意见不同也能礼貌对待。
相比之下,大洋彼岸的几个主要玩家则显得不那么令人满意。
那里的交流常常充满激烈的争执和对立,仿佛部落间的争夺。

并非场面客套话。
在为期36小时的中国之行中,Nathan访问了多个知名AI实验室,如月之暗面、智谱、清华、美团和小米等,并与他们进行了深入对话。
经过这次交流,他对中国AI领域的发展模式有了新的认识:
一种以合作为基础的共赢机制在发挥作用。
基于这些观察,Nathan撰写了一篇文章,分享了他在此次访问中所见所感的故事。
在中国,所有的实验室都对字节跳动保持敬畏之心,而DeepSeek则是众人尊敬的对象。
北京的科技环境与硅谷颇为相似,他仅用了36小时就参观了六家AI公司。
当Nathan询问一位研究人员关于AI风险的看法时,对方表现出困惑——这似乎不是一个常见的讨论话题。
中国的大企业如美团和小米也在自主研发大模型,这种现象被视为理所当然。
每当抬起头来,总是能看到忙碌的建设工地,这些场景仿佛是工程师文化的象征。
尽管MiniMax表示希望下次能前往上海和深圳参观,但Nathan对此深感满意。

下面是他文章的一部分内容摘要:
Enjoy。
中国研究员的心态
文章探讨了中国实验室为何能够迅速追赶技术前沿的原因。
他认为文化因素是关键所在。
要制作一个优秀的LLM,需要对数据、架构和RL算法进行全方位的优化。每个方面都需要精细打磨才能实现最佳效果。
在某些情况下,天才研究员的工作可能要为整体模型的发展让步。
然而,在美国这往往会导致内部冲突加剧。
Nathan透露了一则业内传言:Llama团队因内部斗争严重而解散。
由于过分强调个人的想法和主张,有时需要额外的资金来安抚顶级研究员。
因此,他得出了一个结论:
强烈的自我意识和野心会妨碍模型质量的提升。
相比之下,在中国实验室中观察到了一种不同的现象:
这里的学生被视作核心贡献者,并直接参与重要项目的研发工作。
他们愿意承担那些不那么吸引人的任务,只要能改善模型性能就行。
而在美国的顶级公司如OpenAI和Anthropic等,则很少提供实习机会。
即便有实习项目,实习生也往往被限制在边缘位置,难以接触到核心工作内容。
然而,在中国的情况表明,学生的参与能够显著加快研究进展速度。
此外,这些学生还带来了新的视角和观点。
近年来LLM的关键范式从Scaling MoE到Scaling RL再到Agent不断变化,每一次转变都需要吸收大量新知识。
学生们擅长快速学习并投入其中。
Nathan注意到一个有趣的现象。当他询问中国研究员对AI经济影响的看法时,许多人都表示他们专注于技术本身,而非关注宏观层面的问题。
愣了一下。
相较于美国的文化倾向,中国的科学家更倾向于埋头工作而不必过多发声。
在硅谷文化中,成为明星科学家被视为一种成功路径,并且许多人喜欢参加诸如Dwarkesh和Lex Fridman这样的播客节目。
一位研究员引用了Dan Wang的话来形容中美差异:中国是工程师治理的国家,而美国则是律师主导的社会。
这一说法形象地概括了两国的不同之处——解决实际问题与定义问题的区别。
总结一下,Nathan认为存在以下几点重要的文化区别:
乐于承担那些虽然不那么光鲜但能直接提升模型质量的任务。

新加入AI领域的人员不受前一轮炒作周期的影响,能够更快地适应新技术的发展。
较弱的自我意识有助于组织结构更好地扩展和运作。
大量人才具备解决已验证概念问题的能力。
Nathan在北京的访问经历十分有趣。
他说北京就像是一个充满竞争者的环境,随便走几步就能遇到竞争对手的企业总部。
北京=硅谷
他刚下飞机就顺便参观了阿里巴巴北京园区,并在接下来的36小时内拜访了智谱、月之暗面等多家知名机构。
在交流中,Nathan向研究员们询问关于中国的人才流动情况。他们告诉他跳槽是常态,主要看团队氛围是否合适。
不过,在AI领域内,实验室之间更像是一种生态系统而非竞争对手的关系。
所有的实验室对字节跳动和豆包都十分关注,而Nathan认为字节是中国少数几个采用闭源方式推进大模型开发的公司之一。
跟美国差不多。
同时,所有人都尊敬DeepSeek,因为它被认为是研究品味最高的实验室之一。
这种尊重与美国研究人员之间的紧张关系形成了鲜明对比。
在中国,大家似乎默认形成了一种默契共识。
他发现,在谈到商业化问题时,中国的研究员们往往显得不以为然。
相比之下,在美国,每个人对产业趋势都有详尽的了解和见解。
国内AI行业的实际面貌
在文化差异之外,Nathan还谈到了他在产业层面观察到的一些重要区别。以下是他提到的一些有趣之处:

中国AI需求早期信号
常有一种观点认为中国的AI市场较小,因为中国企业不太愿意为软件付费。但Nathan指出这一判断只说对了一部分情况。
在云计算市场上,企业对AI的投入更多地转向了云服务而非传统的SaaS模式。
关键在于:企业的开支是倾向于支持SaaS还是云端服务?
Nathan觉得大部分投资更偏向于后者,并且没有人质疑这种趋势的有效性。
中国公司的自主研发理念
西方人可能会对美团和蚂蚁集团等公司研发大模型感到不解,但在他们看来这是理所当然的事情。
这些企业普遍认为控制技术栈是至关重要的。
美国公司每年在训练环境上的花费高达数亿美元,Nathan想知道中国实验室是否也采取类似策略?
事实上,由于国内数据产业质量参差不齐,自建方案更受欢迎。
实验室通常会自己搭建RL训练环境或依赖内部团队进行数据标注工作。
在文章结尾处,Nathan提到了“了解”的重要性。
他表示来之前对中国知之甚少,在访问之后反而更加意识到自己的认知局限。
中国的文化和现代技术建设交织在一起,形成了独特的动力和化学反应。
经过与多个领先AI实验室的交流,他发现中国有着许多无法用西方框架解释的独特品质。
对于为何要开源辛苦训练出的模型这一问题,Nathan也感到困惑不解。
3、算力不足
然而,这些公司并不认为每个模型都必须公开发布,但他们愿意支持开发者和生态系统的建设,并将这视为了解技术的一种途径。
4、数据产业不够成熟
这些企业构建LLM不仅仅是为了跟上潮流或提升知名度,背后有着更加深刻的动机:
掌控核心技术栈的意愿强烈而明确。
在文章结尾部分,Nathan坦诚地表达了他对未来的某些担忧:
他不希望美国实验室在所有AI领域保持绝对领先地位——尤其是在开源模型方面。
尾声
考虑到自己是美国人这一身份背景,这其实是一种真实的想法和偏好。
全球范围内推动开源生态的发展有利于打造更安全、实用且易于获取的AI技术。
但现在的问题在于硅谷是否能够保持其领导地位?
这最终还是回到了对中国开源文化这一话题的关注上。
关于这一点,Nathan在文章结尾用了一个形象的比喻:
每当他从笔记本电脑抬起头时,总能看到地平线上忙碌施工的身影。
这种景象与中国倡导的开放精神显然是一致的。
这些公司构建LLM,并不是因为追逐热点,想在新潮技术里刷存在感。
这一切的背后,是一种Nathan没有想过强烈的深层愿望:
把技术栈掌控在自己手中。
这也让Nathan在文章结尾,直言自己有些许焦虑:
如果说我不希望美国实验室在AI的每个领域都保持明确领先——特别是在开源模型这块——那我就是在骗人。
我是美国人,这是一个诚实的偏好。
我希望开源生态能在全球繁荣。这能为世界创造更安全、更可及、更有用的AI。
但现在的问题是,硅谷是否能保住这个领导地位?
归根结底,依旧是在谈中国开源文化这件事。
关于这一点,Nathan说了一句非常有画面感的话,很适合用作结尾:
当我从笔记本电脑上抬起头,总能看到地平线上的一簇簇起重机。
这跟中国的开源精神,显然是一脉相承的。
