
新智元报道
斯坦福大学发布了最新的《AI指数报告》,该报告指出,人工智能领域正在经历前所未有的发展速度。
报告揭示了人工智能领域的最新趋势,强调了技术进步的速度和影响范围。
AI 指数报告显示,全球范围内的人工智能研究与应用正以惊人的速度增长。

该报告总结了过去一年中人工智能领域的重要进展,并展望未来的发展方向。
报告指出,目前人工智能的使用已经渗透到各个行业和国家。
研究发现,在生成式AI技术的应用上,中国、印度等新兴市场表现出强劲的增长势头。
中国的职场中,AI工具的使用率已超过80%。
报告显示,尽管人工智能的发展速度惊人,但在透明度方面却存在显著下降的趋势。
尽管生成式 AI 的全球渗透率达到53%,但不同国家之间的差异仍然明显。
在过去三年里,生成式AI的普及程度超过了个人电脑和互联网的历史记录。

该指数报告还指出,美国在AI研究人员流入方面正面临严峻挑战。
数据显示,在过去的十年中,进入美国从事人工智能研究工作的人员数量下降了89%。
美国仍然是全球AI研究人员密度最高的国家之一,但其吸引人才的能力正在减弱。
近年来,流入美国的AI研究者和开发者的比例急剧减少。

其他亮点速览:
这一趋势主要体现在年轻一代就业市场上的显著变化。
最近的研究发现,在22岁至25岁的软件开发者中,约有20%的人失业。
与此同时,年龄更大的同行群体反而在增长。
此外,客服等其他高AI暴露行业也在出现类似模式。
大多数企业高管预计未来几个月内将进行更大规模的裁员。
这种现象不仅限于美国,全球多个经济体都出现了年轻开发人员就业率下降的情况。
另一方面,人工智能正改变科学研究的方式和方法。
中美贴脸
差距只剩2.7%
在自然科学、物理科学以及生命科学领域中,AI相关论文的数量在过去一年增长了约四分之一至三分之一。
今年首次有AI系统实现了端到端的天气预报流程,完全不需要传统的数值模型支持。
AI技术的进步使得科学家们能够直接从原始气象观测数据生成温度、风速和湿度等最终预测结果。

医院也开始采用能自动生成临床记录的人工智能工具来提高工作效率并减少医生的工作压力。
然而,AI在真实医疗环境中的实际效果尚需进一步验证。许多研究依赖于标准化考试题式的数据集而非真实的病人数据。
当前的教育体系尚未跟上人工智能技术发展的步伐。

在美国,超过四分之三的学生正在使用AI来完成学校作业。
同时,只有不到十分之一的中学有明确的AI使用政策,并且教师们普遍对这些政策的理解不足。
自学在全球范围内掀起热潮。阿联酋、智利和南非成为学习人工智能工程技能增长最快的国家。
报告还指出,最强大的模型正在变得更加不透明。


今年发布的95个代表性模型中,只有少数几个公开了训练代码。
同时,公众对于AI的态度变得越来越复杂和矛盾。
全球范围内认为AI利大于弊的比例上升到近六成,但同时感到紧张的人也有所增加。

美国民众对本国政府监管AI技术的信心最低,仅为三成左右。
该报告还揭示了公众与专家在评估人工智能影响上的巨大分歧。
报告中的数据表明,在某些关键领域,如就业、医疗和经济等方面,两者的观点差距甚至超过了百分之三十。
尽管实验室里的曲线飞涨,但普通人的不安情绪却在累积。
封神速度史无前例
该报告包含了几百张图表来展示各种趋势的发展情况。
报告指出,在时间轴上,模型能力、算力以及投资和采用率的曲线都在不断上升。

而其他所有方面的进展则相对停滞不前或者出现下滑。
对于身处行业中的个人而言,当前最紧迫的问题不再是未来会怎样,而是自己站在哪一条曲线上。
报告全文及更多详细信息可在此链接中查看:https://hai.stanford.edu/ai-index/2026-ai-index-report

基准一年封顶
AI没有瓶颈
最猛的曲线是编程。
欲了解AI指数报告的关键要点和见解,请参阅该链接中的更多信息:https://hai.stanford.edu/news/inside-the-ai-index-12-takeaways-from-the-2026-report
了解更多关于人工智能领域当前进展的科学分析,可在此处查看原文:https://www.nature.com/articles/d41586-026-01199-z

报告全文PDF版本也可通过该链接下载获取:https://hai.stanford.edu/assets/files/ai_index_report_2026.pdf
网络安全Agent解决问题的成功率,从15%涨到93%。
Gemini Deep Think在国际数学奥林匹克拿到金牌。
PhD级科学问答(GPQA Diamond)、竞赛数学(AIME)、多模态推理(MMMU)这些原本被认为「人类不可超越」的硬骨头,全部被前沿模型啃了下来。
|
|

最能说明问题的是Humanity's Last Exam。
这是一个专门被设计来「难倒AI、偏袒人类专家」的测试,题目由各个领域的顶尖专家提供。
去年OpenAI的o1拿到8.8%,前沿模型在一年时间里把分数往上又推了30个百分点,目前Claude Opus 4.6和Gemini 3.1 Pro已经双双过了50%。

锯齿前沿
能拿IMO金牌却看不懂表
但同一份指数甩出了另一组数字。
最强模型在「读模拟时钟」这个任务上的正确率,是50.1%。


机器人在实验室仿真环境(RLBench)里的操作成功率已经达到89.4%。但搬到真实家庭场景里完成洗碗、叠衣服这类家务,成功率立刻掉到12%。
实验室和厨房之间,差了77个百分点。
研究者把这种现象命名为「锯齿前沿」(jagged frontier)。AI能力的分布是凹凸不平的,能拿数学奥赛金牌,却没法稳定地告诉你现在几点。
AI能在数学奥赛拿金牌,但只有一半的概率能看懂模拟时钟。AI在加速,但加速的不是同一个方向。
|
|
另外,在智能体任务中,OSWorld测试中,前沿AI实力(66.3%)正逼近人类基线。

然而,在专门评估科研逻辑的PaperArena测试中,最强AI加持的Agent,得分仅39%,只有博士生一半的功力。

但这种凹凸已经不影响企业把AI往生产线上塞。
AI Index给出的另一个数字是,全球企业AI采用率达到88%。九成的公司已经把AI接进了某个工作流。
代价同步在涨。AI相关事故记录从2024年的233起涨到362起。

钱在加速
5817亿砸进AI
2025年全球企业AI投资达到5817亿美元,同比增长130%。其中私募投资3447亿美元,同比增长127.5%。
两条曲线都几乎翻倍。
国别上,美国一骑绝尘。2025年美国私募AI投资2859亿美元。并且一年新增1953家AI创业公司,也是排名第二的10倍以上。

钱在加速涌向美国。但美国的另一项核心资源,正在反向流动。
人在流走
进美国的AI研究者跌了89%
里面有一组数字让人愣了一下。
2017年到现在,进入美国的AI研究人员和开发者数量下降了89%。
更关键的是,这个下降在加速。仅仅过去一年,下降幅度就达到80%。

美国仍然是全球AI研究人员密度最高的国家,但流入的水龙头正在拧紧。
钱和人这两条曲线开始反向。这是过去十年没出现过的局面。
算力三年涨30倍
命门都在一家公司手里
AI能力曲线在加速,背后那条算力曲线跑得更猛。
从2021年到现在,全球AI算力总量涨了30倍。过去三年里,每年都在翻三倍以上。

撑起这条曲线的是少数几家公司。
英伟达一家的GPU,占据了全世界AI算力的60%以上。亚马逊和谷歌靠自研芯片排在二三位,但加起来也远远追不上英伟达。
而几乎所有这些芯片,都来自一家代工厂,台积电。算力曲线越陡,命门就越窄。
与此同时,代价也在加大。
全球AI数据中心的总功率已经达到29.6 GW,相当于纽约州在用电高峰时段的全部用电需求。xAI Grok 4一次训练的估算碳排放是72816吨二氧化碳当量,相当于17000辆汽车开一整年的尾气。
数据中心建在哪里,电从哪里来,芯片从哪里产,这三个问题已经变成今年所有AI公司CEO案头最头疼的事。
生成式AI三年渗透53%
中国职场使用率破80%
生成式AI在三年内达到了53%的全球人口渗透率。
这个速度比个人电脑快,比互联网快。
但渗透速度和国别相关性极强。新加坡61%,阿联酋54%,都跑在美国前面。美国在调查覆盖国家中只排第24位,渗透率28.3%。
如果把维度从消费者换成职场,反差更大。
报告里另一组数据显示,2025年全球58%的员工在工作中已经开始经常性使用AI。但在中国、印度、尼日利亚、阿联酋、沙特这5个国家,这个比例超过了80%。
中国的职场AI渗透率,已经比全球平均高出20个百分点以上。

更有意思的是消费者价值。
AI Index估算,到2026年初,生成式AI工具每年给美国消费者创造1720亿美元的价值。从2025年到2026年,每个用户的中位数价值翻了三倍。
绝大多数用户用的还是免费版。
普通人愿意为AI付的钱,远低于AI给他们创造的价值。这中间的剪刀差是现在所有AI公司都在试图弥合的东西。
入门岗位锐减
22-25岁开发岗狂砍20%
整份AI Index里最让中文读者沉默的,可能是关于年轻就业的部分。
22到25岁的软件开发者群体,从2024年至今,就业人数下降了大约20%。
同期,年纪更大的同行群体反而在增长。
不止开发岗。客服等其他高AI暴露行业,也在出现同样的模式。
更让人担心的是企业问卷的结果。受访高管普遍预期,未来的裁员幅度会比过去几个月还要大。
这不是宏观失业率的事,是入口岗位被精准切掉的事。
第一份工作没了,整个职业阶梯就断了一格。这件事的长期影响,现在没人能算清。

AI正在改写科学发现的方式
如果说就业那一段是冷的,科学这段就是热的。
自然科学、物理科学、生命科学领域的AI相关论文,2025年同比增长了26%到28%。
具体到应用,今年第一次有AI完整跑通了端到端的天气预报流程。从原始气象观测数据直接吐出温度、风速、湿度的最终预报,中间没有任何传统数值模型介入。
AI从「帮你写论文」「帮你算数字」,正在变成「自己做发现」。

医院里也是一样。2025年大量医院开始部署能从就诊对话自动生成临床记录的AI工具。多个医院系统的医生反馈,写病历的时间减少了多达83%,工作倦怠显著下降。
但同一份指数给医疗AI泼了一盆冷水。一份针对500多个临床AI研究的综述发现,将近一半的研究依赖考试题式的数据集,只有5%用了真实临床数据。
AI能减少医生敲键盘的时间,这件事是确定的。AI在真实病人身上的临床价值,目前还有大量问号。

自学浪潮全球开炸
正规教育已经掉队
正规教育跟不上AI了。
美国有4/5的高中生和大学生现在用AI完成学校作业。但只有一半的中学有AI使用政策,只有6%的老师认为这些政策写得清楚。
学生跑在前面,老师还在原地,规则还没出现。

正规教育跟不上的同时,自学浪潮在全球开炸。里面写,学AI工程技能增长最快的三个国家分别是阿联酋、智利和南非。
不是美国,不是欧洲。
技能曲线的最陡峭的那一段,长在所有人都没在看的地方。

最强模型变成最不透明的
专家和公众撕裂
最强的模型,正在变成最不透明的模型。
Foundation Model Transparency Index今年的平均分从去年的58分跌到了40分。AI Index直接点名,谷歌、Anthropic、OpenAI都已经放弃公开最新模型的训练数据规模和训练时长。
去年发布的95个最具代表性的模型里,80个没有公开训练代码。
公众的情绪也变得更复杂。

全球范围内,认为AI利大于弊的比例从52%上升到59%。但同期,对AI感到紧张的比例从50%上升到52%。
两个方向在同时增长。
最分裂的是美国。只有33%的美国人认为AI会让自己的工作变得更好,全球平均是40%。美国人对本国政府监管AI的信任度,是受访国家里最低的,31%。
新加坡人对自己政府监管AI的信任度,是81%。

最近Sam Altman家被袭击的事件之后,硅谷圈内人「惊讶地发现」Instagram评论区里的普通人对此并不同情,甚至有人觉得「应该更激烈一点」。
他们没意识到事情已经糟到这个程度。
研报引用的Pew和Ipsos数据,专家和公众在AI影响就业、医疗、经济这些维度上的观感差距,普遍超过30个百分点,最大的一项达到50个百分点。
一边是实验室里的曲线在飞涨,一边是普通人心里的不安在累积。
中间没有桥。
写在最后
423页的报告里有几百张图表,但其实只画了一张图。
横轴是时间,纵轴是能力。
模型能力的曲线在飞,算力曲线在飞,投资曲线在飞,采用率曲线在飞。其他全都在原地踏步或者向下。
这就是2026年AI Index的全部内容。
AI在加速。其他所有东西都在脱节。
如果你是这个行业里的人,现在该问的问题不是「未来会怎样」,而是「自己站在哪一条曲线上」。
参考资料:
https://hai.stanford.edu/ai-index/2026-ai-index-report
https://hai.stanford.edu/news/inside-the-ai-index-12-takeaways-from-the-2026-report
https://www.nature.com/articles/d41586-026-01199-z
https://hai.stanford.edu/assets/files/ai_index_report_2026.pdf




