今天,在华为中国合作伙伴大会2026现场,我采访了华为昇腾计算基础软件业务总经理李守平。问到CANN已通过分层解耦实现全量开源后,在超节点集群上部署万亿参数大模型时,软件层面怎么做到更高算力利用率和更低时延。

李守平的回答很务实:CANN面对一个完整系统时,包含计算、单元间连接等几大块(实际涉及四个核心组件)。关键在于如何把它们有效整合,实现算力价值最大化,这本身就是系统性创新。
他特别强调,华为超节点和业界传统集群不一样。传统往往只是把旧节点简单堆起来,而华为做到了统一内存、统一编址。从协议层面就减少了数据包和开销,底层负载轻了很多。上层则通过专家并行标准化设计,充分利用高带宽,即使万亿参数模型要切分资源,也能把带宽优势用足,避免浪费。
这种系统级的重构能力令人印象深刻。但更让我触动的,是华为在生态战略上的“升维”与彻底兑现。过去行业谈国产替代,往往还停留在“能否跑通CUDA代码”的被动防御阶段,试图在别人的地基上修补房子;而今天,随着CANN的全量开源和超节点协议的主动开放,华为已不再满足于单纯的“可用”,而是选择将底层技术的定义权交还给社区。这标志着华为的战略重心已从“构建自主能力”转向“共建开放标准”。事实正在证明,真正的护城河不是封闭的代码壁垒,是由全球开发者共同编织的协作网络。
李守平提到的“统一内存编址”和“协议层减负”,本质上是在用软件定义的思维去重塑硬件边界。这很像当年Linux对抗Unix的路径。当底层足够透明,上层的应用创新才会爆发。对于国内那些苦于算力成本高昂、定制需求无法响应的AI初创公司来说,这或许是一个信号:与其在别人的花园里修修补补,不如在自己的土壤上种树。
当然,挑战依然巨大。CUDA二十年的积累不是靠一次开源就能抹平的,开发者的习惯迁移、工具链的细腻度,都需要时间打磨。但方向比速度更重要。当国产算力开始从“卖盒子”转向“卖能力”,从“兼容者”变成“定义者”,这场关于AI基础设施的长期主义战役,才算真正进入了深水区。
更新时间:2026-03-24
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号