
智东西
编译 佳扬
编辑 云鹏
最近,全球人工智能领域的热度不断攀升,随之而来的是计算能力的紧缺问题日益严重。
作为行业领军者之一的Anthropic公司,在近期遭遇了一系列挑战:系统频繁中断、服务稳定性下降以及客户投诉增多等问题。截至4月8日的数据表明,该公司旗下Claude API在过去90天内的正常运行时间仅为98.95%,未能达到软件企业通常承诺的99.99%标准。

▲Claude API服务中断时间
值得注意的是,《华尔街日报》曾报道指出,由于算力紧张,OpenAI不得不调整其战略方向,停止了备受市场关注的Sora视频生成应用的研发工作,转而集中资源开发代号为“Spud”的新型人工智能模型以及企业级产品。
在此背景下,高端图形处理器(GPU)租赁费用出现了显著增长。英伟达最新款Blackwell系列芯片每小时租金已达4.08美元,相比两个月前的2.75美元上涨了约48%。
当前,各大人工智能巨头正面临算力短缺带来的严峻挑战,并采取了一系列措施应对这一问题。
Anthropic公司的首席财务官莎拉·弗莱尔在最近的一次投资者会议上表示:“我们正在积极寻找任何可以利用的计算资源。由于可用资源有限,不得不做出一些艰难的选择。”
近期数据显示,OpenAI API的日均token使用量从2023年10月的60亿次激增至今年3月下旬的150亿次,在短短五个月内增长了150%。
与此同时,Anthropic公司的发展前景同样不容乐观。最初预计到2025年底实现90亿美元年度收入的目标,现在已被大幅提升至300亿美元。
为了应对日益紧张的资源状况,自今年三月下旬开始,Anthropic宣布在工作日早间高峰时段限制用户使用的token数量,此举引发了一些用户的不满情绪。Claude Code创始人兼负责人Boris Cherny对此回应称,公司正在全力提高产能以满足持续增长的需求。
二、越来越贵的算力
数据提供商Ornn的数据显示,在过去几个月里,英伟达全系列GPU产品价格大幅上涨,尤其是在数据中心和云端访问方面的价格上涨尤为显著。
随着算力需求激增,行业中的定价机制也随之发生变化。去年年底,全球领先的AI云服务公司之一CoreWeave将其GPU租赁费用上调了超过20%。同时,该公司还延长了小型客户的合同期限,从一年变为至少三年,并预计到2029年之前市场供不应求的局面仍将持续。
目前,高端GPU的租金价格已经飙升至每小时4.08美元,较两个月前增长了约50%,凸显出当前市场上计算资源的稀缺程度。
“这是五年来我所见过最严重的容量短缺。”云基础设施公司Vultr首席执行官JJ Kardwell直言,算力供给不足的主要原因在于设备部署周期过长以及电力供应紧张等因素。
三、算力短缺导致AI服务质量低,客户流失
算力短缺不仅提高了运营成本,还直接影响了AI服务的质量和稳定性。自2月中旬以来,Anthropic的系统故障频发,并导致一些企业客户转向其他提供商寻求解决方案。
对于任何核心互联网服务而言,“9”级别的可用性是衡量其可靠性的标准之一。然而,截至4月8日的数据表明,Anthropic的Claude API在过去三个月中的正常运行时间仅为98.95%,远低于行业常规水平的99.99%。
人工智能推理初创公司Baseten联合创始人兼首席技术官Amir Haghighat对此评价道:“当前AI行业的服务质量与传统互联网服务相差甚远,没有企业愿意选择稳定性如此差的服务提供商。”
结语:AI的算力竞争
当技术创新的速度超越了基础设施建设的步伐时,考验的不仅是企业的技术实力,更是整个产业链在算力供给短缺情况下的应对能力。
对于押注人工智能领域的科技巨头而言,在项目取舍、成本控制与服务质量之间找到平衡点将是未来需要解决的重要问题。
