奇异摩尔受邀出席2025多样性算力产业发展大会

51495 0 2025-12-02

为探究多样性算力发展新模式、推动国内算力产业优化升级,中国通信标准化协会多样性算力产业及标准推进委员会(CCSA TC622)将于2025年11月18日在北京香格里拉饭店举办“多样性算力产业发展大会2025”,届时多位顶尖专家将共话前沿技术趋势、共谋多元算力发展新未来。

作为AI网络互联领域的创新者,奇异摩尔联合创始人、产品及解决方案副总裁祝俊东受邀出席本次大会,并将在“AI芯片高速互联技术(Scale -up)”分论坛发表主题演讲:AI原生时代:超节点芯粒加速AI芯片高速互联(Scale -up)。

超节点:破解AI算力瓶颈的关键钥匙

随着大语言模型(LLM)参数规模已突破万亿级,训练与推理的计算和通信需求迅速攀升,传统多卡xPU服务器算力与显存瓶颈日益凸显。分布式训练中,张量并行(TP)依赖的All-Reduce通信与混合专家模型(MoE)中的All-to-All通信,对网络带宽与延迟提出前所未有的苛求。

在此背景下,构建高带宽、低延迟的Scale Up网络成为关键路径,其目标是将数百乃至上千张AI加速卡紧密互联,形成统一调度的超节点,实现跨设备的高效协同。超节点的优势场景为通信开销较大的AI任务,如大模型训练、高并发推理、实时交互等。随着NVL72、CloudMatrix 384等系统商用,超节点架构正从概念走向部署核心。

未来Scale Up网络的发展将围绕下列技术路线协同演进:

1超节点规模化

超节点正通过单机柜超节点(每机柜<20kW)迈向多机柜超节点(每机柜>100kW),并由机柜级向集群级扩展。

2SerDes速率跃升

作为芯片、芯粒间数据传输的底层引擎,SerDes速率正从112G向224G/448G PAM4跃迁,成为支撑超节点带宽的关键。

3存算一体集成

存算一体技术通过近存计算、存内计算等路线,突破AI计算中数据搬移的能耗瓶颈,实现能效数量级提升。

4光互联与CPO迈向成熟

在机柜层面,光互联技术使得超节点单机柜部署迈向双机柜,与机柜形态解耦可弹性拓展算力规模,突破现有机柜功耗限制及互联瓶颈,提升系统级效能;在芯片层面,CPO将光引擎与xPU计算芯粒/Switch芯片共封装,以取代可插拔光模块,解决功耗与信号衰减问题,聚焦实现带宽密度与能效的数量级提升。

  • 随机文章
  • 热门文章
  • 热评文章