- 专业PCB设计平台 20年专业经验 - 专业PCB设计平台 20年专业经验

展开 关闭
官方QQ - 电子设计有限公司
QQ
120568531
官方微信 - 电子设计有限公司
微信
官方二维码 - 电子设计有限公司
留言咨询
留言
联系电话
电话
400-7650 8329
联系邮箱
邮件
pocketGames@ynzhjc.com
Banner 新闻动态 - 电子设计有限公司

新闻动态

News
返回首页
公司新闻
公司新闻
国产万卡超集群首次真机亮相,具备四大核心技术优势

2025-12-23 02:01:24

点击数 197

【导语】12月18日光合组织2025人工智能创新大会上,中科曙光全球首发真机亮相的国产万卡级AI集群系统——scaleX万卡超集群,凭借单节(jié)点(diǎn)高(gāo)算(suàn)力(lì)集成(chéng)、原(yuán)生(shēng)RDMA高(gāo)速(sù)网(wǎng)络(luò)、存(cún)算(suàn)传(chuán)深(shēn)度(dù)优(yōu)化(huà)、数(shù)字(zì)孪(luán)生(shēng)智(zhì)能(néng)调(diào)度(dù)四(sì)大(dà)核(hé)心(xīn)技(jì)术(shù)优(yōu)势(shì),为(wèi)大(dà)模(mó)型(xíng)训(xun)练(liàn)、金融风控等多元场景提供强大算力支撑,成为(wèi)“AI计(jì)算(suàn)开(kāi)放(fàng)架(jià)构(gòu)”最(zuì)新(xīn)重(zhòng)磅(bàng)成(chéng)果(guǒ)。

12月(yuè)18日(rì),在(zài)昆(kūn)山(shān)举(jǔ)行(xíng)的(de)光(guāng)合(hé)组(zǔ)织(zhī)2025人(rén)工(gōng)智(zhì)能(néng)创(chuàng)新(xīn)大(dà)会(huì)(HAIC2025)上(shàng),中(zhōng)科(kē)曙(shǔ)光(guāng)发(fā)布(bù)并(bìng)展(zhǎn)出(chū)了(le)全球(qiú)领(lǐng)先(xiān)的(de)大(dà)规(guī)模(mó)智(zhì)能(néng)计(jì)算(suàn)系(xì)统(tǒng)——scaleX万(wàn)卡(kǎ)超(chāo)集群,这也是国产万卡级AI集群系统首次以真机形式亮相。

万卡集群.j

据了解,此次发布的万卡超集群具有四大核心技术优势:

优势一,单节点实现640张算力卡集成,算力密度高。scaleX万卡超集群由16个曙光scaleX640超节点通过scaleFabric高速网络互连而成,可实现10240块AI加速卡部署,总算力规模超过5EFlops。曙光scaleX640超节点采用超高密度刀片模块分区设计,使单机柜算力密度相较于国内领先产品的常规部署方式提升20倍,采用浸没相变液冷散热技术, 使集群PUE值(电源使用效率,数据中心总能耗与IT设备能耗的比值)降低至1.04。

优势二,自主研发原生RDMA高速网络,通信效率高。集群超节点间通信采用曙光scaleFabric网络,基于国内首款400G 类InfiniBand原生RDMA网卡与交换芯片,可实现400Gb/s超高带宽、同时端侧通信延迟低于1微秒,超节点间的通信性能达到业内领先水平,充分释放万卡超集群算力,并可将超集群规模扩展至10 万卡以上,传输速率相比传统InfiniBand网络提升2.33倍,同时网络总体成本降低30%。

优势三,存、算、传紧耦合深度优化,计算响应速度高。万卡超级群通过“超级隧道”、AI数据加速等设计,实现从芯片级、系统级到应用级的三级数据传输协同优化,使存力平台能够高效应对大模型训练时万卡并发读写带来的带宽极致需求挑战,高通量AI推理时的响应速度与结果精准度实现提升, AI加速卡资源利用率相较传统架构方案提高55%。

优势四,采用超集群数字孪生与智能调度技术,实现集群智能运营。集群通过物理集群数字孪生,实现故障定位、修复等全流程可视化智能管理;智能化运维平台可支撑集群长期可用性达99.99%;智能调度引擎可管理万级节点、服务十万级用户,支持每秒万级作业调度。

9月5日,中科曙光协同20余家产业链伙伴,共同推出了“AI计算开放架构”。scaleX万卡超集群是 “AI计算开放架构”最新重磅成果,可支持多品牌加速卡以及主流计算生态,实现400多款主流大模型、世界模型等的适配优化。在实际应用中,该超集群可服务于大模型训练、金融风控、地质能源勘探及科学智能等多元场景。


列表新闻列表