中国超算时隔 8 年夺冠，算力破 200 亿亿次，为啥没装 GPU？

近日，全球超算 TOP500 榜单更新。中国自主研制的凌胜超算拿下冠军，时隔八年重回第一。

榜单显示，凌胜的持续双精度浮点性能达到 2.198EFlops，换算下来就是每秒超 200 亿亿次运算。

第二名是美国劳伦斯利弗莫尔国家实验室的 EI Capitan，第三名为橡树岭国家实验室的 Frontier，两者算力分别为 1.809EFlops 和 1.353EFlops。按照官方解释，1EFlops 就是每秒百亿亿次浮点运算。

全球 80 亿人每人拿计算器每秒算一次，凑齐 1EFlops 需要整整四年。凌胜一秒的工作量，相当于全人类算四年，凌胜成为全球首台持续性能突破 200 亿亿次的超算。

上一次中国超算登顶 TOP500 还是 2018 年。早在 2010 年，天河一号就首次拿下全球第一；2013 到 2015 年，天河二号连续霸榜；2016 到 2018 年，神威・太湖之光也蝉联冠军。

2018 年 6 月，美国 IBM 的 Summit 终结了中国超算的霸榜时代，之后 6 年间中国超算排名持续下滑。外界曾猜测，美国对华禁售高性能芯片是主因。

但实际上，2020 年后美国升级基础技术封锁，为避免泄露架构机密，中国超算的公开参数暂停了更新，这次凌胜重回榜首更具特殊意义。纯 CPU 架构是这次登顶的核心王牌。

和全球排名前十的超算大多采用的 CPU+GPU 异构架构不同，凌胜没有独立 GPU 计算单元，全程靠 CPU 核心支撑算力。

凌胜的硬件全部实现自主可控：它搭载 20480 个计算节点，每个节点配 2 块 LX2 处理器；每块处理器含 2 个计算核心，每个核心拆分 4 个运算单元，每个单元再带 38 个 CPU 核心，总 CPU 核心数超过 1200 万。

官方只公开 CPU 架构为鲲鹏 V9，外界推测是华为海思基于鲲鹏处理器定制，还集成了和昇腾 950DT 同款的 HBM 内存。

软件层面，凌胜采用国防科技大学基于银河麒麟开发的 Linux 操作系统，服务器机架由浪潮定制，能保证高负载下稳定运行，不会因过热降频。不少人疑惑，没有 GPU 怎么撑起这么强的算力？

其实每颗 LX2 处理器的 CPU 核心内，都集成了专门的矩阵加速单元。单颗 CPU 核心的加速能力不如 GPU，但 1200 万核心叠加后，整体算力反超了第二名的 EI Capitan。

超算和 AI 算力根本不是一回事。有人问，没有 GPU 也能赢，是不是就不需要国产 GPU 了？答案是否定的。

超算的核心需求是高精度双精度浮点运算，适合气象模拟、流体力学等科学计算，对运算误差要求极高。而大模型更看重计算效率，更适合半精度浮点运算，GPU 是这类任务的主力。

美国的超算既能做科学计算，也能跑大模型，但国内纯 CPU 架构解决了封锁下的国家级科学计算刚需。

同时，纯 CPU 架构和 GPU 的应用场景完全不同：前者更像专业算盘，重点满足特定高精度计算需求；后者是完整计算系统，能覆盖更多精度选择和商业场景。凌胜登顶，是美国技术封锁下中国超算技术突破的证明，守住了国家级科学计算的底线。

但这并不代表我们可以停下研发国产 GPU 和异构集成技术的脚步，科学计算和商业 AI 的制高点，一个都不能丢。

更新时间：2026-07-01

“破卷向善”协商对话具有重要示范意义