DeepSeek风靡美国，研究员36小时亲历中国AI热潮挑战字节光环

作者：世界网2026年5月8日科技1 阅读

中国AI领域的研究员们给人留下了亲切、真诚的印象。

艾伦研究所（Ai2）的研究员Nathan Lambert在结束对中国访问后，表达了他对中国的深深感触。

在他看来，这里的LLM社区如同天堂般存在，成员之间相互尊重，即使意见不同也能礼貌对待。

相比之下，大洋彼岸的几个主要玩家则显得不那么令人满意。

那里的交流常常充满激烈的争执和对立，仿佛部落间的争夺。

飞书文档 - 图片

并非场面客套话。

在为期36小时的中国之行中，Nathan访问了多个知名AI实验室，如月之暗面、智谱、清华、美团和小米等，并与他们进行了深入对话。

经过这次交流，他对中国AI领域的发展模式有了新的认识：

一种以合作为基础的共赢机制在发挥作用。

基于这些观察，Nathan撰写了一篇文章，分享了他在此次访问中所见所感的故事。

在中国，所有的实验室都对字节跳动保持敬畏之心，而DeepSeek则是众人尊敬的对象。

北京的科技环境与硅谷颇为相似，他仅用了36小时就参观了六家AI公司。

当Nathan询问一位研究人员关于AI风险的看法时，对方表现出困惑——这似乎不是一个常见的讨论话题。

中国的大企业如美团和小米也在自主研发大模型，这种现象被视为理所当然。

每当抬起头来，总是能看到忙碌的建设工地，这些场景仿佛是工程师文化的象征。

尽管MiniMax表示希望下次能前往上海和深圳参观，但Nathan对此深感满意。

下面是他文章的一部分内容摘要：

Enjoy。

中国研究员的心态

文章探讨了中国实验室为何能够迅速追赶技术前沿的原因。

他认为文化因素是关键所在。

要制作一个优秀的LLM，需要对数据、架构和RL算法进行全方位的优化。每个方面都需要精细打磨才能实现最佳效果。

在某些情况下，天才研究员的工作可能要为整体模型的发展让步。

然而，在美国这往往会导致内部冲突加剧。

Nathan透露了一则业内传言：Llama团队因内部斗争严重而解散。

由于过分强调个人的想法和主张，有时需要额外的资金来安抚顶级研究员。

因此，他得出了一个结论：

强烈的自我意识和野心会妨碍模型质量的提升。

相比之下，在中国实验室中观察到了一种不同的现象：

这里的学生被视作核心贡献者，并直接参与重要项目的研发工作。

他们愿意承担那些不那么吸引人的任务，只要能改善模型性能就行。

而在美国的顶级公司如OpenAI和Anthropic等，则很少提供实习机会。

即便有实习项目，实习生也往往被限制在边缘位置，难以接触到核心工作内容。

然而，在中国的情况表明，学生的参与能够显著加快研究进展速度。

此外，这些学生还带来了新的视角和观点。

近年来LLM的关键范式从Scaling MoE到Scaling RL再到Agent不断变化，每一次转变都需要吸收大量新知识。

学生们擅长快速学习并投入其中。

Nathan注意到一个有趣的现象。当他询问中国研究员对AI经济影响的看法时，许多人都表示他们专注于技术本身，而非关注宏观层面的问题。

愣了一下。

相较于美国的文化倾向，中国的科学家更倾向于埋头工作而不必过多发声。

在硅谷文化中，成为明星科学家被视为一种成功路径，并且许多人喜欢参加诸如Dwarkesh和Lex Fridman这样的播客节目。

一位研究员引用了Dan Wang的话来形容中美差异：中国是工程师治理的国家，而美国则是律师主导的社会。

这一说法形象地概括了两国的不同之处——解决实际问题与定义问题的区别。

总结一下，Nathan认为存在以下几点重要的文化区别：

乐于承担那些虽然不那么光鲜但能直接提升模型质量的任务。

新加入AI领域的人员不受前一轮炒作周期的影响，能够更快地适应新技术的发展。

较弱的自我意识有助于组织结构更好地扩展和运作。

大量人才具备解决已验证概念问题的能力。

Nathan在北京的访问经历十分有趣。

他说北京就像是一个充满竞争者的环境，随便走几步就能遇到竞争对手的企业总部。

北京=硅谷

他刚下飞机就顺便参观了阿里巴巴北京园区，并在接下来的36小时内拜访了智谱、月之暗面等多家知名机构。

在交流中，Nathan向研究员们询问关于中国的人才流动情况。他们告诉他跳槽是常态，主要看团队氛围是否合适。

不过，在AI领域内，实验室之间更像是一种生态系统而非竞争对手的关系。

所有的实验室对字节跳动和豆包都十分关注，而Nathan认为字节是中国少数几个采用闭源方式推进大模型开发的公司之一。

跟美国差不多。

同时，所有人都尊敬DeepSeek，因为它被认为是研究品味最高的实验室之一。

这种尊重与美国研究人员之间的紧张关系形成了鲜明对比。

在中国，大家似乎默认形成了一种默契共识。

他发现，在谈到商业化问题时，中国的研究员们往往显得不以为然。

相比之下，在美国，每个人对产业趋势都有详尽的了解和见解。

国内AI行业的实际面貌

在文化差异之外，Nathan还谈到了他在产业层面观察到的一些重要区别。以下是他提到的一些有趣之处：

中国AI需求早期信号

常有一种观点认为中国的AI市场较小，因为中国企业不太愿意为软件付费。但Nathan指出这一判断只说对了一部分情况。

在云计算市场上，企业对AI的投入更多地转向了云服务而非传统的SaaS模式。

关键在于：企业的开支是倾向于支持SaaS还是云端服务？

Nathan觉得大部分投资更偏向于后者，并且没有人质疑这种趋势的有效性。

中国公司的自主研发理念

西方人可能会对美团和蚂蚁集团等公司研发大模型感到不解，但在他们看来这是理所当然的事情。

这些企业普遍认为控制技术栈是至关重要的。

美国公司每年在训练环境上的花费高达数亿美元，Nathan想知道中国实验室是否也采取类似策略？

事实上，由于国内数据产业质量参差不齐，自建方案更受欢迎。

实验室通常会自己搭建RL训练环境或依赖内部团队进行数据标注工作。

在文章结尾处，Nathan提到了“了解”的重要性。

他表示来之前对中国知之甚少，在访问之后反而更加意识到自己的认知局限。

中国的文化和现代技术建设交织在一起，形成了独特的动力和化学反应。

经过与多个领先AI实验室的交流，他发现中国有着许多无法用西方框架解释的独特品质。

对于为何要开源辛苦训练出的模型这一问题，Nathan也感到困惑不解。

3、算力不足

然而，这些公司并不认为每个模型都必须公开发布，但他们愿意支持开发者和生态系统的建设，并将这视为了解技术的一种途径。

4、数据产业不够成熟

这些企业构建LLM不仅仅是为了跟上潮流或提升知名度，背后有着更加深刻的动机：

掌控核心技术栈的意愿强烈而明确。

在文章结尾部分，Nathan坦诚地表达了他对未来的某些担忧：

他不希望美国实验室在所有AI领域保持绝对领先地位——尤其是在开源模型方面。

尾声

考虑到自己是美国人这一身份背景，这其实是一种真实的想法和偏好。

全球范围内推动开源生态的发展有利于打造更安全、实用且易于获取的AI技术。

但现在的问题在于硅谷是否能够保持其领导地位？

这最终还是回到了对中国开源文化这一话题的关注上。

关于这一点，Nathan在文章结尾用了一个形象的比喻：

每当他从笔记本电脑抬起头时，总能看到地平线上忙碌施工的身影。

这种景象与中国倡导的开放精神显然是一致的。

这些公司构建LLM，并不是因为追逐热点，想在新潮技术里刷存在感。

这一切的背后，是一种Nathan没有想过强烈的深层愿望：

把技术栈掌控在自己手中。

这也让Nathan在文章结尾，直言自己有些许焦虑：

如果说我不希望美国实验室在AI的每个领域都保持明确领先——特别是在开源模型这块——那我就是在骗人。

我是美国人，这是一个诚实的偏好。

我希望开源生态能在全球繁荣。这能为世界创造更安全、更可及、更有用的AI。

但现在的问题是，硅谷是否能保住这个领导地位？

归根结底，依旧是在谈中国开源文化这件事。

关于这一点，Nathan说了一句非常有画面感的话，很适合用作结尾：

当我从笔记本电脑上抬起头，总能看到地平线上的一簇簇起重机。

这跟中国的开源精神，显然是一脉相承的。

“”

免责声明：由于无法甄别是否为投稿用户创作以及文章的准确性,本站尊重并保护知识产权，根据《信息网络传播权保护条例》，如我们转载的作品侵犯了您的权利,请您通知我们，请将本侵权页面网址发送邮件到[email protected]，深感抱歉，我们会做删除处理。

DeepSeek风靡美国，研究员36小时亲历中国AI热潮挑战字节光环

作者：世界网2026年5月8日科技1 阅读

中国AI领域的研究员们给人留下了亲切、真诚的印象。

艾伦研究所（Ai2）的研究员Nathan Lambert在结束对中国访问后，表达了他对中国的深深感触。

在他看来，这里的LLM社区如同天堂般存在，成员之间相互尊重，即使意见不同也能礼貌对待。

相比之下，大洋彼岸的几个主要玩家则显得不那么令人满意。

那里的交流常常充满激烈的争执和对立，仿佛部落间的争夺。

飞书文档 - 图片

并非场面客套话。

在为期36小时的中国之行中，Nathan访问了多个知名AI实验室，如月之暗面、智谱、清华、美团和小米等，并与他们进行了深入对话。

经过这次交流，他对中国AI领域的发展模式有了新的认识：

一种以合作为基础的共赢机制在发挥作用。

基于这些观察，Nathan撰写了一篇文章，分享了他在此次访问中所见所感的故事。

在中国，所有的实验室都对字节跳动保持敬畏之心，而DeepSeek则是众人尊敬的对象。

北京的科技环境与硅谷颇为相似，他仅用了36小时就参观了六家AI公司。

当Nathan询问一位研究人员关于AI风险的看法时，对方表现出困惑——这似乎不是一个常见的讨论话题。

中国的大企业如美团和小米也在自主研发大模型，这种现象被视为理所当然。

每当抬起头来，总是能看到忙碌的建设工地，这些场景仿佛是工程师文化的象征。

尽管MiniMax表示希望下次能前往上海和深圳参观，但Nathan对此深感满意。

下面是他文章的一部分内容摘要：

Enjoy。

中国研究员的心态

文章探讨了中国实验室为何能够迅速追赶技术前沿的原因。

他认为文化因素是关键所在。

要制作一个优秀的LLM，需要对数据、架构和RL算法进行全方位的优化。每个方面都需要精细打磨才能实现最佳效果。

在某些情况下，天才研究员的工作可能要为整体模型的发展让步。

然而，在美国这往往会导致内部冲突加剧。

Nathan透露了一则业内传言：Llama团队因内部斗争严重而解散。

由于过分强调个人的想法和主张，有时需要额外的资金来安抚顶级研究员。

因此，他得出了一个结论：

强烈的自我意识和野心会妨碍模型质量的提升。

相比之下，在中国实验室中观察到了一种不同的现象：

这里的学生被视作核心贡献者，并直接参与重要项目的研发工作。

他们愿意承担那些不那么吸引人的任务，只要能改善模型性能就行。

而在美国的顶级公司如OpenAI和Anthropic等，则很少提供实习机会。

即便有实习项目，实习生也往往被限制在边缘位置，难以接触到核心工作内容。

然而，在中国的情况表明，学生的参与能够显著加快研究进展速度。

此外，这些学生还带来了新的视角和观点。

近年来LLM的关键范式从Scaling MoE到Scaling RL再到Agent不断变化，每一次转变都需要吸收大量新知识。

学生们擅长快速学习并投入其中。

Nathan注意到一个有趣的现象。当他询问中国研究员对AI经济影响的看法时，许多人都表示他们专注于技术本身，而非关注宏观层面的问题。

愣了一下。

相较于美国的文化倾向，中国的科学家更倾向于埋头工作而不必过多发声。

在硅谷文化中，成为明星科学家被视为一种成功路径，并且许多人喜欢参加诸如Dwarkesh和Lex Fridman这样的播客节目。

一位研究员引用了Dan Wang的话来形容中美差异：中国是工程师治理的国家，而美国则是律师主导的社会。

这一说法形象地概括了两国的不同之处——解决实际问题与定义问题的区别。

总结一下，Nathan认为存在以下几点重要的文化区别：

乐于承担那些虽然不那么光鲜但能直接提升模型质量的任务。

新加入AI领域的人员不受前一轮炒作周期的影响，能够更快地适应新技术的发展。

较弱的自我意识有助于组织结构更好地扩展和运作。

大量人才具备解决已验证概念问题的能力。

Nathan在北京的访问经历十分有趣。

他说北京就像是一个充满竞争者的环境，随便走几步就能遇到竞争对手的企业总部。

北京=硅谷

他刚下飞机就顺便参观了阿里巴巴北京园区，并在接下来的36小时内拜访了智谱、月之暗面等多家知名机构。

在交流中，Nathan向研究员们询问关于中国的人才流动情况。他们告诉他跳槽是常态，主要看团队氛围是否合适。

不过，在AI领域内，实验室之间更像是一种生态系统而非竞争对手的关系。

所有的实验室对字节跳动和豆包都十分关注，而Nathan认为字节是中国少数几个采用闭源方式推进大模型开发的公司之一。

跟美国差不多。

同时，所有人都尊敬DeepSeek，因为它被认为是研究品味最高的实验室之一。

这种尊重与美国研究人员之间的紧张关系形成了鲜明对比。

在中国，大家似乎默认形成了一种默契共识。

他发现，在谈到商业化问题时，中国的研究员们往往显得不以为然。

相比之下，在美国，每个人对产业趋势都有详尽的了解和见解。

国内AI行业的实际面貌

在文化差异之外，Nathan还谈到了他在产业层面观察到的一些重要区别。以下是他提到的一些有趣之处：

中国AI需求早期信号

常有一种观点认为中国的AI市场较小，因为中国企业不太愿意为软件付费。但Nathan指出这一判断只说对了一部分情况。

在云计算市场上，企业对AI的投入更多地转向了云服务而非传统的SaaS模式。

关键在于：企业的开支是倾向于支持SaaS还是云端服务？

Nathan觉得大部分投资更偏向于后者，并且没有人质疑这种趋势的有效性。

中国公司的自主研发理念

西方人可能会对美团和蚂蚁集团等公司研发大模型感到不解，但在他们看来这是理所当然的事情。

这些企业普遍认为控制技术栈是至关重要的。

美国公司每年在训练环境上的花费高达数亿美元，Nathan想知道中国实验室是否也采取类似策略？

事实上，由于国内数据产业质量参差不齐，自建方案更受欢迎。

实验室通常会自己搭建RL训练环境或依赖内部团队进行数据标注工作。

在文章结尾处，Nathan提到了“了解”的重要性。

他表示来之前对中国知之甚少，在访问之后反而更加意识到自己的认知局限。

中国的文化和现代技术建设交织在一起，形成了独特的动力和化学反应。

经过与多个领先AI实验室的交流，他发现中国有着许多无法用西方框架解释的独特品质。

对于为何要开源辛苦训练出的模型这一问题，Nathan也感到困惑不解。

3、算力不足

然而，这些公司并不认为每个模型都必须公开发布，但他们愿意支持开发者和生态系统的建设，并将这视为了解技术的一种途径。

4、数据产业不够成熟

这些企业构建LLM不仅仅是为了跟上潮流或提升知名度，背后有着更加深刻的动机：

掌控核心技术栈的意愿强烈而明确。

在文章结尾部分，Nathan坦诚地表达了他对未来的某些担忧：

他不希望美国实验室在所有AI领域保持绝对领先地位——尤其是在开源模型方面。

尾声

考虑到自己是美国人这一身份背景，这其实是一种真实的想法和偏好。

全球范围内推动开源生态的发展有利于打造更安全、实用且易于获取的AI技术。

但现在的问题在于硅谷是否能够保持其领导地位？

这最终还是回到了对中国开源文化这一话题的关注上。

关于这一点，Nathan在文章结尾用了一个形象的比喻：

每当他从笔记本电脑抬起头时，总能看到地平线上忙碌施工的身影。

这种景象与中国倡导的开放精神显然是一致的。

这些公司构建LLM，并不是因为追逐热点，想在新潮技术里刷存在感。

这一切的背后，是一种Nathan没有想过强烈的深层愿望：

把技术栈掌控在自己手中。

这也让Nathan在文章结尾，直言自己有些许焦虑：

如果说我不希望美国实验室在AI的每个领域都保持明确领先——特别是在开源模型这块——那我就是在骗人。

我是美国人，这是一个诚实的偏好。

我希望开源生态能在全球繁荣。这能为世界创造更安全、更可及、更有用的AI。

但现在的问题是，硅谷是否能保住这个领导地位？

归根结底，依旧是在谈中国开源文化这件事。

关于这一点，Nathan说了一句非常有画面感的话，很适合用作结尾：

当我从笔记本电脑上抬起头，总能看到地平线上的一簇簇起重机。

这跟中国的开源精神，显然是一脉相承的。

“”

DeepSeek风靡美国，研究员36小时亲历中国AI热潮挑战字节光环

DeepSeek风靡美国，研究员36小时亲历中国AI热潮挑战字节光环

相关文章

相关文章