谷歌与无晶圆半导体公司Marvell的最新合作计划正在酝酿中。
据知情人士透露,两家公司正商讨开发两款全新芯片事宜,包括一款专为运行AI模型而设计的TPU以及一种能够与谷歌现有的TPU协同工作的内存处理单元。值得注意的是,博通长期以来一直是谷歌TPU的主要设计合作伙伴。
谷歌预计最快在明年完成对新内存处理单元的设计工作,并计划生产近200万颗该型号芯片,但确切的数量可能仍会有变动。
一位匿名的谷歌员工透露,公司对于研发新一代推理芯片已早有布局。今年三月,英伟达发布了旨在提高推理效率的新款LPU芯片后,谷歌随即加快了相关研究的步伐。
英伟达的LPU是基于从Groq获得的技术授权而开发出来的,而此次合作的对象Marvell曾作为Groq第一代LPU的设计合作伙伴,在设计推理芯片方面积累了丰富的经验和技术储备。
谷歌过去在芯片领域主要依赖于博通公司,但由于后者高昂的成本模式导致了成本的显著增加。因此,谷歌正在积极寻找减少对博通依赖的方法。
此前就有报道指出,早在2023年,谷歌就已经开始考虑将Marvell作为潜在替代供应商,以减轻对博通在数据中心网络接口芯片供应上的单一依赖。
为了降低风险,谷歌于去年引入了联发科参与TPU的设计与制造工作。
尽管如此,在本月初,谷歌还是和博通签订了新的合作协议,该协议将合作期限延长至2031年,并涵盖定制化TPU及网络组件的供应。这表明博通在谷歌未来的芯片体系中仍将占据重要地位。
摩根士丹利曾预测,谷歌到2027年的TPU产量将达到600万颗,但双方合作中的新TPU设计完成时间及量产规模目前尚未明确。
谷歌当前使用的芯片全部由台积电代工生产,至于新款芯片是否会继续选择台积电或其他制造商进行制造,现阶段仍未有定论。
在与Marvell的新一轮合作谈判之前,谷歌曾向后者采购过用于管理数据中心服务器间内存共享的CXL控制器芯片。这两名知情人士表示,这些芯片都是现货标准产品,并未涉及定制化开发的合作内容。
近年来,谷歌仅在其自有数据中心内部署TPU,主要用于支持搜索、YouTube及Gemini大模型等业务。然而,在去年,谷歌开始向客户开放TPU算力租赁服务,允许其部署在非谷歌的数据中心内,这直接挑战了英伟达在AI芯片领域的主导地位。
目前包括Anthropic、Meta以及苹果在内的多家公司已经采用了谷歌的TPU产品。
Marvell专注于设计数据中心通用网络、存储及光互联芯片,并为客户提供定制化服务,该业务已成为其增长最快的领域之一。
随着AI Agent对计算能力的需求不断上升,专用推理芯片的研发趋势也在持续升温。
除了降低单一供应商的依赖度外,谷歌与Marvell的合作还反映了当前行业的发展趋势:AI推理任务正朝着更加专业化和细分化的方向发展。
现今的AI应用如智能代理对计算资源的需求远大于传统的聊天机器人等应用程序。随着越来越多的企业推出更复杂的智能体产品,专用推理芯片市场将迎来快速发展期。
除了谷歌之外,OpenAI也已与Cerebras公司达成协议,计划在未来几年内投资超过200亿美元购买其推理芯片,并且也在考虑自主研发推理芯片的可能性。
总结而言,在提高效率和控制成本的需求驱动下,为特定任务定制专用推理芯片而非依赖单一处理器已经成为头部厂商的主流趋势。这将推动AI芯片从通用化向更专业化的方向发展。
综合来说,为不同任务搭配专用推理芯片,而非依靠单一处理器包揽全部工作,也在逐渐成为头部厂商提升效率、控制成本的选择趋势。在此趋势下,AI芯片有望加速从通用化路线,向更贴合场景、更聚焦专业功能的方向分化发展。
