最近,在中国家电及消费电子博览会上,一个最新的成果——采用光路交换技术重塑智能计算网络架构的项目宣告正式落地。
上海仪电携手曦智科技、壁仞科技和中兴通讯发布了“光跃超节点128卡商用版”,该产品实现了长期稳定的训练状态,显著提升了模型训练性能,且传输延迟比传统电交换技术减少了90%以上。
这款超节点的核心是曦智科技的全球首创硅光OCS光交换芯片。早在去年7月的WAIC大会上,这一项目就已经首次亮相,仅用了不到一年的时间,便成功完成了从概念验证到实际商用的转变。这是国内首个端到端OCS批量部署方案。
此方案成功适配了多项国产大型模型,如阶跃星辰和DeepSeek等,证明其具有成为高性价比、高能效国产计算解决方案的潜力。
在面对大模型训练中传统电交换网络日益严峻的功耗和延迟问题时,OCS技术凭借其低功耗、低延迟和调度灵活性的特点,成为了突破算力效能瓶颈的关键。
传统电路交换网络在数据中心中占据主导地位,主要原因是技术成熟和生态完善。
从原理上看,电分组交换机首先将来自光纤链路的光信号转换为电信号,然后在交换芯片中对数据包进行解析与转发,最后再通过光模块将电信号转换回光信号并发送。
整个过程依赖于“光-电-光”(O-E-O)的转换与电子交换芯片完成数据处理。光模块负责光信号和电信号之间的转换,而交换芯片则负责读取、缓存与路由。
这个过程类似于一个繁忙的铁路货运站,当满载数据的列车到达时,必须进站停车,卸货、分拣、重新编组到另一列车上,再发车出站。每次列车在站内的停顿和装卸设备的运转,都会带来更高的延迟和能耗。
比如,400G光模块的功耗大约为10W,传输1比特数据所消耗的能量大约为25皮焦耳。再加上交换机内部处理信号的SerDes芯片本身的功耗,总的能耗会超过30 pJ/bit。更先进的800G模块虽然在能效上有所提升,但单位能耗仍保持在15–20 pJ/bit的水平。
在超大规模数据中心中,这种能耗将迅速累积,增加运营成本,同时也给散热和系统设计带来巨大压力。

这正是OCS能够发挥重要作用的领域。
OCS可以在物理层直接改变光信号的传播路径。当数据流到达交换节点时,无需像电交换那样经历复杂的切换过程,只需调整方向即可直接将光信号引导到目标链路上,从而建立一条端到端的光通路。
它类似于在铁路网络中部署了一套智能道岔系统,光列车无需进站停车,直接切换轨道方向,保持高速直通状态。虽然维持这个“道岔”系统的运行仍需要能量,但与O-E-O转换相比,其能耗显著降低,理论上可以达到fj/bit的量级。
除了能耗与延迟之外,OCS还在带宽、可靠性和兼容性方面具有优势。它不受电子交换芯片端口速率和SerDes速率的限制,可以更轻松地支持高带宽的数据传输;也不依赖于特定的数据传输协议,能够无缝兼容不同厂商使用的互连协议,消除生态锁闭风险。
同时,OCS可以在物理层快速重新建立光路。当某条链路或设备出现故障时,网络可以在几秒内通过重新配置光通路绕过故障路径,从而提高网络的整体稳定性和容错能力。
OCS技术路线多样,国内企业正积极探索实际可行的方案。
OCS的优势显著,但技术门槛较高,涉及多学科交叉。不同厂商和研究机构正在基于各自的技术积累和产业生态进行探索,有的延续传统光通信中的MEMS光开关路径,有的尝试基于硅光波导实现高度集成化的光交换,还有一些方案采用液晶、压电陶瓷等光学调控技术。
在这些技术路径中,MEMS光交换方案是目前相对成熟的一种方案。该方案通过微型可动反射镜阵列改变光束传播方向,实现端口之间的光路重构。
谷歌是全球范围内唯一完成OCS大规模量产部署的公司,已有10年左右的研发经验,其方案基于MEMS。结合谷歌开发的全栈软件,这一方案极大提高了TPU训练集群的数据交换效率。
MEMS方案的优势在于端口规模大、光学性能稳定;但其也存在一定局限,例如机械结构带来的切换速度限制(目前为毫秒级)、器件体积较大以及系统封装复杂度较高、价格昂贵等。
另一条备受关注的路线是硅光OCS。该方案利用硅基波导等器件在芯片上实现光信号的路由与切换。相比MEMS依赖微机械结构的方式,硅光方案没有机械运动,切换速度可达微秒甚至纳秒级。

一些初创公司正在推动硅光OCS的发展,例如国内的曦智科技等企业。曦智打造了全球首创的基于硅光子技术的OCS光交换芯片,相关研究论文被国际通信网络领域顶级会议SIGCOMM 2025接收。
硅光OCS还能够依托成熟的CMOS制造工艺实现规模化生产,并具备更好的集成度和潜在的成本优势。但在光损耗控制以及热串扰问题等方面,还有优化空间。
除了MEMS和硅光之外,OCS领域还存在一些其他技术路线,例如基于液晶材料调控光路的方案,以及利用压电陶瓷驱动光学结构改变传播路径的方案等。这些技术各有特点,在切换速度、稳定性或成本方面提供了不同的工程权衡。

总体而言,OCS领域正处于“多路线并行探索”的阶段,各种技术在端口规模、切换速度、能效与可制造性之间不断寻找平衡,尚未出现绝对主导路线,未来很可能会在不同应用场景中形成多种技术并存的格局。
结合国内当前的发展阶段和技术环境,依托成熟半导体制造体系的硅光路线,在产业链协同和规模化制造方面具备一定现实优势,也因此成为曦智等国内企业探索的一条自主可控、兼具高性能与高能效的国产算力路线。
英伟达等头部玩家正在用行动投票。本月,英伟达分别向Lumentum(MEMS路径)和Coherent(液晶路径)这两家专注于OCS技术的企业投资了20亿美元,并签署了多年数十亿美元的采购承诺和未来产能优先获取权,体现出其对OCS的长期看好。
沈亦晨表示:“2-3年前,曦智便判断未来数据中心30%的芯片都会是光芯片,英伟达也一定会全面拥抱光芯片。”这次英伟达的押注,其实是因为光芯片即将在其产品中“快速起量”,因此需对供应链进行提前布局。
至于不同技术路径的选择,沈亦晨保持了开放的态度。在他看来,不同OCS技术路径虽有具体指标的差异,但核心功能共性高达80%-90%。现阶段的首要任务是将光交换集群从概念变为现实,落地部署大规模光互连光交换集群。
此外,硬件落地是软件优化的前提。只有先拥有一套实体的光交换集群,软件和系统才能针对其特性进行优化。从“电交换”改为“光交换”是软件层面最重要的变革环节,在光交换体系内部,后续对软件层面的优化属于“边际收益”。
沈亦晨类比道:“与其现在纠结于用哪一种技术路线的电机,不如先让一辆电动车上路。车能上路,配套设施自然就会建起来。”
结语:数据中心网络“以光换电”,中国方案抢占技术高地
OCS技术正以前所未有的方式重塑AI算力基础设施,它不仅在能耗、延迟和带宽上带来质的飞跃,也为下一代超大规模大模型的训练、推理和广泛落地提供了坚实支撑。
在OCS加速落地的进程中,以曦智科技为代表的中国企业,正凭借硅光OCS芯片、光跃超节点等创新实践,探索一条自主可控、兼具高性能与高能效的国产算力路线。
沈亦晨透露,未来除了在训练侧支撑千卡、万卡级别集群之外,曦智也计划扩展128卡商用版本超节点在推理侧的应用。而在今年的WAIC大会上,曦智将会公开下一代光交换集群的方案。
我们也与沈亦晨聊到了英伟达在OCS赛道的这一大动作。沈亦晨称:“2-3年前,曦智便做出判断,未来数据中心30%的芯片都会是光芯片,英伟达也一定会全面拥抱光芯片。”这次英伟达的押注,其实是因为光芯片即将在其产品中“快速起量”,因此需对供应链进行提前布局。
至于不同技术路径的选择,沈亦晨保持了开放的态度。在他看来,不同OCS技术路径虽有具体指标的差异,但核心功能共性高达80%-90%。现阶段的首要任务是将光交换集群从概念变为现实,落地部署大规模光互连光交换集群。
此外,硬件落地是软件优化的前提。只有先拥有一套实体的光交换集群,软件和系统才能针对其特性进行优化。从“电交换”改为“光交换”是软件层面最重要的变革环节,在光交换体系内部,后续对软件层面的优化属于“边际收益(marginal gain)”。
沈亦晨类比道:“与其现在纠结于用哪一种技术路线的电机,不如先让一辆电动车上路。车能上路,配套设施自然就会建起来。”
结语:数据中心网络“以光换电”,中国方案抢占技术高地
OCS技术正以前所未有的方式重塑AI算力基础设施。它不仅在能耗、延迟和带宽上带来质的飞跃,也为下一代超大规模大模型的训练、推理和广泛落地,提供了坚实支撑。
而在OCS加速落地的进程中,以曦智科技为代表的中国企业,正凭借硅光OCS芯片、光跃超节点等创新实践,探索一条自主可控、兼具高性能与高能效的国产算力路线。
沈亦晨透露,未来,除了在训练侧支撑千卡、万卡级别集群之外,曦智也计划扩展128卡商用版本超节点在推理侧的应用。而在今年的WAIC大会上,曦智将会公开下一代光交换集群的方案。
