亚马逊因内部AI生成代码的问题导致系统瘫痪,马斯克则发表了一条意味深长的推文。

根据多家媒体报道,这家电子商务巨头在本周二紧急提升了名为“本周商店技术”(TWiST)会议的重要性,并要求全体员工参加,以深入分析近期由人工智能引发的一系列宕机事件的原因。
埃隆·马斯克利用社交媒体留下了简短却引人深思的评语:“Proceed with caution.”(谨慎前行)。
这句话直接点出了科技巨头们在推动AI编程时所面临的挑战,即当依赖人工智能生成的代码出现问题时,可能会导致整个系统的大面积瘫痪,这表明完全依靠AI来提高效率的想法显得过于乐观了。

一、现场报道:一场重大危机
内部简报显示,亚马逊员工最近正经历着艰难时期。
“大家都知道近期网站和相关基础设施的稳定性并不理想。”戴夫·特雷德韦尔在内部邮件中这样写道。

实际上,“不理想”这个词只是高管们的一种委婉表达方式。实际上,系统接连出现严重的故障。
·购物车消失:月初时,亚马逊遭遇了一次长达6小时的网站及App宕机事件,全球超过2.2万名用户报告无法完成结账、看不到价格或登录失败的问题。官方最初将其归咎于“代码部署错误”,但内部调查却揭示了更深层次的原因。
·影响范围广泛:简报中频繁提到一个术语——高爆炸半径(High Blast Radius),表明故障不再是局部的小问题,而是可能导致整个业务的瘫痪。

·AI成为诱因:简报明确指出,过去几个月发生的故障呈现出一种趋势性变化,核心变量是“生成式AI辅助下的代码变更”。
简单来说,当程序员大量使用AI工具编写代码时,即便这些代码能够正常运行,也往往隐藏着足以导致系统大面积瘫痪的隐患。
二、细节分析:AI如何引发亚马逊危机?
在亚马逊内部,公司高管向员工们推广了Q助手和Kiro等AI编码工具。然而,这些声称能提高效率的AI工具最终却成了故障发生的推手。
网络安全专家卢卡斯·奥莱尼克分享了一个典型的案例:在一次AWS事故中,工程师授权内部AI编码工具Kiro进行环境优化操作。结果该AI做出了一个惊人的决定——删除并重建整个环境以解决一个小问题。
正如奥莱尼克形容的那样,这就像为了修理漏水水龙头却推倒了一面墙一样极端。

这次事件导致AWS服务中断了整整13小时。虽然亚马逊官方后来辩称这只是“用户授权错误”,但AI在理解和评估操作后果方面依然存在盲区。
亚马逊在简报中承认,针对生成式AI的使用,目前的最佳实践和安全措施尚未完全建立起来。
英伟达AI高级经理亚伦·埃里克森则指出问题的核心在于管理层面。他在社交媒体上评论道:“能够随意编写具有巨大爆炸半径代码并导致系统故障,这是一个系统性问题,而非仅仅是AI的问题。”
三、矛盾的现状:一边裁员,一边增加人工审核

当前亚马逊的情况,是当代大公司降低运营成本和提高效率的一个典型例子。
一方面是在大规模裁员的同时大力推广人工智能技术。
自去年年底以来,亚马逊已经裁减了数万名员工,并在今年一月又削减了1.6万个岗位。官方给出的理由是为了提升效率和保持组织文化的统一性。与此同时,公司内部却设定了一个硬性指标,要求80%的开发人员每周至少使用一次AI编码工具。
另一方面则是巨大的基础设施投入,亚马逊预计到2026年资本支出将攀升至约2000亿美元,其中大部分资金都将用于AI硬件上。

结果在本周二会议上出现了一个令人尴尬的场景。为了防止AI继续引发严重故障,副总裁特雷德韦尔提出了一项新规定:初级和中级工程师使用AI生成代码变更时,必须经过高级工程师的手动签字审核。尽管亚马逊官方随后向媒体否认了这一强制性要求。
这就产生了一个商业悖论:为了节省成本而解雇大量员工,结果却发现人工智能出错的几率远超想象,最终依然需要依赖那些留下的资深员工来把关AI生成的代码。
正如一位网友在社交媒体上的嘲讽:“所以亚马逊修复AI问题的方法是雇佣更多的人?我还以为我们已经跨过那个阶段了呢。”
四、马斯克的观点与谨慎前行

再次回到文章开头提到的马斯克那句“Proceed with caution.”(谨慎前行)。
马斯克对AI的态度一直充满矛盾。一方面,他支持人工智能技术的发展,并预言到2026年底AI将完全跳过编程阶段;另一方面,他也深知在技术尚未成熟前过度依赖算法的潜在风险。
这种风险不仅在于代码出错的可能性增大,还在于人类对系统掌控力的削弱。

卢卡斯·奥莱尼克在接受采访时警告说,从以人为中心的编码模式快速转向AI主导的方式可能导致安全检查的缺失。如果这种未经严格验证的做法继续下去,后果可能不只是短暂的服务中断,而是对企业核心业务造成重创。
“我并不反对部署人工智能技术,这不可避免。”奥莱尼克表示,“但我反对的是为了速度而忽视风险或只是为了使用AI而用它。在被淘汰和业务瘫痪之间存在一个中间地带。”
五、程序员的挑战期来临
亚马逊发生的这场危机实际上给所有互联网从业者敲响了警钟。
·代码的价值与贬值:当人工智能可以在一秒钟内生成大量代码时,基础编程工作的价值便变得廉价。然而随之而来的是维护和理解成本的大幅上升,未来的核心竞争力将不再只是写代码的能力,而是审核和纠错的能力。
·平庸化风险:如果中低级开发人员完全依赖AI进行工作,他们将失去在排错过程中成长的机会。当这一代程序员不再了解底层架构时,一旦AI出现问题或停止运行,将没有人能够迅速接管系统。
·防护措施的滞后:目前大多数AI编码工具更像是概率预测机,它们可以生成看起来规范化的代码,但却无法评估具体操作对整个金融、支付及物流链条的影响。
卢卡斯·奥莱尼克在推文中建议:“必须确定合适的模式,并制定相应的流程等,这样最终情况才会趋于稳定。”
六、结语:警惕效率的陷阱

尽管内部简报揭示了严重的隐患问题,但亚马逊对外仍然坚称这是一次普通的例行会议。
然而,马斯克和那些大面积瘫痪的故障已经捅破了一层窗户纸。人工智能确实可以成为加速器,但如果缺乏完善的防护机制而盲目推进,则会增加系统全面崩溃的风险。
对于每个人来说,无论是开发者还是管理者,在这场狂热的人工智能浪潮中或许真的需要听听马斯克那句“谨慎前行”。毕竟走稳一点,总比走得快更重要。
对于我们每一个人来说,无论是开发者还是管理者,在狂热的AI浪潮中,或许真的该听听马斯克那句“谨慎前行”。毕竟走稳一点,比走快一点更重要。
