
智东西
编辑 程茜
今日,中科曙光提供的6万卡科学智能(AI for Science)计算集群系统在郑州国家超算互联网核心节点正式启用。作为国内规模最大的此类集群,它凭借卓越的全栈技术实力,能够满足用户从性能优化、软件模型改进到科研应用效率提升等多方面的需求,为“AI+科学技术”的规模化推广提供了坚实保障。
中国科学院院士兼河南省科学院院长徐红星表示:“此集群的成功部署不仅展示了我国在AI领域的最新科技成果,还标志着科研创新与人工智能技术深度融合的一个重要里程碑。我们期待各领域专家和业界人士携手合作,以此为契机,共同把握‘AI+’的发展机遇。”
六大特点铸就最大规模的AI4S集群
为了满足用户对于大规模并行计算、万亿级参数模型训练及高通量推理的需求,中科曙光开发了具有六大特征的AI4S计算集群:
强大的处理能力:实现了6万卡集群部署,并提供全球顶尖级别的超智融合算力。
完整的精度支持:采用自主可控的核心芯片技术,能够支持8/16/32/64位宽的全精度运算,有效应对高维函数和复杂科学问题的处理挑战。
高速互联网络:使用国内首创的类InfiniBand无损高速网络scaleFabric系列产品,完全满足AI4S计算集群对高带宽、低延迟的要求。
存储与计算协同工作:通过“超级隧道”和AI数据加速等创新设计,实现了从芯片到应用层面的三层传输协调机制,避免了存储IO瓶颈的问题。
智能调度能力:智能任务管理系统可根据需求灵活配置并调动集群内的资源,作业并发效率超过每秒万次。
高度稳定性与可靠性保障:借助智能化运维、数字孪生系统以及浸没相变液冷技术等措施,使系统的可用性达到了99.99%,确保了长期稳定运行的需求。
AI4S效率实现千倍提升
中科曙光高级副总裁李斌指出,该AI4S计算集群不仅在硬件性能上表现出色,在软硬件协同设计方面也具有强大的兼容性和广泛的科研应用支持能力,彻底打破了传统超级计算机和智能计算之间的壁垒。
在实际应用场景中,通过与高校、研究机构及企业的紧密合作,目前集群已经在生物科学、材料学等多个领域实现了大规模并行计算测试,并取得了显著成果:例如蛋白质折叠模拟在使用了3万卡规模的条件下比传统的算法快1000倍;另外,在进行4.5万卡规模的万亿原子液态水分子动力学模拟时,不仅打破了世界记录,还使效率提升了三个数量级。此外,该集群还支持湍流直接模拟扩展至百万亿网格级别,进一步提高了科研工作的效率。
同时,随着该集群的成功部署,国家超算互联网平台(scnet.cn)已经建立了国内最大的AI4S计算基础设施,连接了超过300万CPU核心和20多万GPU卡,并接入了一体化全国算网调度系统,为全国各地的高校、科研机构及企业提供普惠化的AI4S算力服务。
从数小时到完成模型开发,降低科学智能体的应用门槛
为了推动AI4S工程化进程,中科曙光结合了国家超算互联网“数算模用”一体化的理念,并推出了国内首个一站式科学大模型开发平台OneScience。该平台集合了大量的数据集、行业知识库、大规模模型以及各类计算软件工具。
OneScience内置了许多热门的AI4S模型和数据集,涵盖了地球科学、生物信息学、流体仿真等多个领域,能够让用户在短短数小时内完成科学大模型开发工作,并解决了复杂环境配置及难以获取数据等问题。
在超算互联网平台上,用户无需面对复杂的软件配置与IT流程即可直接使用曙光AI4S计算集群。只需通过自然语言描述需求,“超级科学计算智能体”就能自动拆解任务、调用模型和调度算力资源,在短短几个小时内完成端到端交付,极大缩短了科研项目的时间周期。
自2025年12月发布scaleX万卡超集群以来,从2026年2月3万卡系统上线国家超算互联网核心节点直至今日的6万卡AI4S计算集群系统的问世,“曙光速度”不断刷新工程化部署能力的新纪录,并实现了从人工智能到科学智能全栈技术跨越的目标,助力我国在“人工智能+”领域占据领先地位。
