
人工智能正从单纯的信息生成转向任务执行,以编码代理为代表的低延迟高吞吐量推理场景,标志着AI基础设施商业化的新阶段即将来临。在供应方面,电力、芯片和数据中心建设几乎没有任何多余的资源,这一状况可能会长期持续。
英伟达首席执行官黄仁勋在GTC 2026大会主题演讲后的专访中,针对AI推理经济、CPU策略、收购Groq的原因以及供应链紧张等问题,发表了一系列看法。
黄仁勋指出,过去一年,人工智能在关键领域实现了突破,尤其是在推理能力方面,这使得模型开始产生实际的经济价值,而编程代理的兴起则是这一变化最明显的体现。英伟达已将超高速低延迟推理纳入其产品组合。
黄仁勋在接受采访时直言,无论是电力还是芯片,几乎所有供应链环节都处于紧张状态。尽管英伟达已为未来的供应链做了规划,但黄仁勋更希望基础设施如土地、电力和数据中心的建设能加快进度,以促进算力扩张和资本投入的实现。
低延迟成为新的付费驱动引擎
黄仁勋将过去一年AI发展的核心突破归结为“推理”能力的进步。他表示,早期的生成式AI由于幻觉问题难以商业化,但推理能力的引入让模型能够通过反思、检索和搜索来实现落地,从而从提供信息跃升到完成任务。
黄仁勋指出,“搜索作为一种服务,人们通常不会为此付费,因为获取信息的成本不高。”然而,现在的AI不仅能与人对话,还能为人做事,这标志着一个全新的起点。
编程是他提到的一个典型案例。他认为,代码生成需要模型对代码块进行整体反思和验证执行结果,这种能力的成熟使工程师能够从逐行写代码转向关注架构和规格设计。
黄仁勋透露,英伟达内部的软件工程师已完全使用编程代理,并且“很多人已经很久没有写过一行代码,但他们的生产力极高。”
正是基于这一判断,英伟达决定将低延迟推理能力纳入其产品线。黄仁勋解释说,现有的GPU系统在最大化吞吐量和智能token质量之间存在内在矛盾,而高价值的编程代理用户愿意为token生成速度提升10倍支付额外费用。
黄仁勋表示,如果Anthropic推出一个能让编程速度提升10倍的Claude Code服务层,他愿意为此付费。
收购Groq:构建推理流水线的战略布局
黄仁勋认为,英伟达收购Groq的决定是其在推理基础设施领域多年布局的自然结果,而非突如其来的举动。
他提到,英伟达在一年前发布Dynamo推理调度框架时,已经开始考虑如何在异构基础设施上更细致地分解推理流程。与Groq的合作早在收购前约六个月就开始了。此次交易的核心在于获得Groq团队和技术授权,而非其云服务业务。
从技术角度看,英伟达计划将推理流水线分解到解码阶段内部,由Vera Rubin GPU处理高FLOP的注意力计算,而由Groq的LPU架构承担需要极高token速率和极低延迟的任务。相关产品预计在今年内推出。
他说道:
黄仁勋强调,对于像Anthropic或OpenAI这样的公司,如果Codex正在创造真实的经济价值,那么加入这个加速器将显著提升收入。
但他也承认,这一方案并非适合所有客户。对于以免费用户为主的平台,引入Groq可能会增加成本和复杂性,不利于业务发展。
黄仁勋将Groq与之前收购Mellanox相提并论,认为两者都代表了英伟达将外部专用架构纳入其计算栈、实现系统级协同优化的一贯策略。他说:“英伟达是一家加速计算公司,而不是仅仅专注于GPU,我们不在乎计算发生在何处,只希望加速应用。”
CPU战略:为AI代理时代重新定义服务器架构
在英伟达长期被视为GPU公司的背景下,黄仁勋在这次采访中详细阐述了英伟达进军CPU市场的逻辑,并介绍了自研Vera CPU的设计理念。
黄仁勋指出,过去十年,CPU设计的目标是为超大规模云计算优化,以最大化可租用的核心数量为目标,而单线程性能不是首要考虑因素。然而,在AI代理场景中,CPU的单线程性能直接影响GPU的整体效率,尤其是当GPU在等待工具调用时。
Vera CPU的核心优势在于内存带宽和I/O带宽,每核心的带宽是目前任何CPU的三倍,旨在减少因I/O瓶颈而拖累GPU的情况。他还提到了与英特尔在NVLink上的合作,以满足企业计算市场对x86生态系统的延续性需求。
黄仁勋将AI代理的工具使用分为两类:结构化工具,包括命令行接口、API和数据库查询;以及非结构化工具,包括需要模型通过多模态感知操作网页界面的应用。英伟达在这两个方向上都有布局。
供应紧平衡:电力与芯片产能双双紧张
针对持续关注的AI算力供应问题,黄仁勋给出了明确的判断:电力和芯片产能都处于紧平衡状态,短期内没有任何一项资源能够翻倍。
“我不认为我们有两倍于需求的电力,也不认为我们有两倍于需求的芯片供应,任何方面都没有两倍的冗余。”他说,“但从我目前看到的情况来看,我们的供应链能够支撑。”
黄仁勋表示,英伟达拥有约两百家长期供应链合作伙伴,并提前进行了上下游规划,对今年和明年的大规模增长持乐观态度。
但他也坦言,当前最大的瓶颈可能不在芯片本身,而是数据中心的土地、电力和建筑的建设速度。他希望这些基础设施能更快地建设完成。
当被问及英伟达是否是算力稀缺的最大受益者时,黄仁勋承认公司规模最大且供应链准备最为充分,但他强调这是长期规划的结果,而非偶然的市场红利。
