文I李Lin环球
编辑I李Lin环球

前言
哈喽,今天小李又来唠点国际事。
美国近期出台新的芯片禁令,但凡总部在中国的企业,哪怕海外注册公司,也被禁止采购高端 AI 芯片。
换作几年前,这种事绝对能刷爆热搜,但这次却连水花都没溅起来。更离谱的是近期特朗普访华,英伟达 CEO 黄仁勋随行还拿到了对华 AI 芯片出口豁免,这条新闻同样没上头条。原因其实很简单:所谓的高端 AI 芯片,我们已经不稀罕了。


我们的算力
回想不久前,国产大模型刚上线时,卡顿、转圈、崩溃、服务器繁忙是常态。但现在,无论是哪家国产大模型,运行都顺滑流畅。这种变化的背后,是中国算力的逆袭。
18.42 万亿的周调用 Token 量,稳居全球第一—— 芯片被卡脖子,但算力反而跑在了前面。这一切的答案,就藏在近期举办的上海金融展上。

可能有人会疑惑:算力相关的技术,为啥会出现在金融展上?其实金融是算力的天然试金石。银行每天处理数亿笔交易,合规风控、反欺诈等环节全靠 AI 运行,AI 能不能跑得动,完全取决于算力底座。
我们可以把算力比作货运吞吐量:过去行业迷信 “卡车越大运货越多”,英伟达的高端芯片就是 “擎天柱”,一趟能拉巨量货物。但我们的运载工具,当时可能只是小翻斗车甚至板车,单趟运力确实不如对方。

但中国工程师换了个思路:单车拼不过没关系,我们可以组建车队,把所有小型运载工具统一调度,让每辆车都满负荷运行。几百辆小车一起干,总运力未必输给擎天柱。
中兴的 26530G3 服务器,就是这支 “车队” 的车队长。这台服务器可插入 20 个单宽 GPU,而且不限品牌。它的核心作用,就是统一调度所有 GPU,最大化压榨性能,让所有算力资源满负荷运行。

光有调度还不够,要是码头卸货慢、仓库入库堵塞、铁路转运卡顿,整体运力还是会被拉低。为此中兴打造了 “5+X 协同设计”:不光让车队跑得快,还把码头、仓库、公路、铁路的所有数据打通,实现智能协同。哪个港口拥堵就绕道,哪个仓库空余多就优先送货。
美国卡我们的高端 GPU,我们就从数据迁移、网络传输、存储等隐形环节死磕效率。测试显示,单个环节效率提升 15%,多个环节叠加后,总效率反超对手 30%。

在金融场景中,这笔效率提升的影响立竿见影:一笔信贷审批原来要等模型跑 3 分钟,现在能做到毫秒级响应。这套逻辑已经被银联、六大国有银行、12 家大型股份制银行采用,国内头部券商、保险机构也开始规模化部署。
但光有车队还不够,多条车队扎堆上路,一定会出现抢道、拥堵的问题。中国工程师干脆直接重新修路 —— 这就是中兴的 OEX 超节点。

传统 GPU 服务器靠排线连接,多进程运行时就像盘山公路,信号传输有明显延时。中兴的 OEX 超节点采用零线缆设计,相当于炸掉盘山公路,修成直穿的隧道。信号路径缩短 30%,就好比把原来走国道等红绿灯的路线,改成了全程高速。
传统机柜最多塞 60 个 GPU,中兴的 OEX 超节点直接翻倍到 128 个,相当于把四车道扩展到二十四车道。别以为密度高了散热会出问题,这套设计反而省电 37%,成本大幅降低。

更关键的是,OEX 超节点不挑芯片:英伟达、AMD、国产海光 DCU 等所有品牌的 GPU,都能混在一个集群里干活,无需重新适配。算力资源就能像水电一样汇入统一网络,由调度系统自动分配。
这套方案最高可组建 1.64 万块 GPU 的超级集群—— 这是过去只有全球顶尖科技巨头才能做到的规模。现在,训练一个千亿参数的大模型,从原来的半年缩短到一个月就能跑完。这也是为什么国产大模型从卡顿变丝滑的根本原因:不是我们买到了秘密芯片,而是我们重构了整个算力体系的底层逻辑。

这套逻辑不止支撑起了中国金融的核心命脉,更撑起了中国 AI 的独立自主。回到最初的问题:为什么高端 GPU 被卡了这么久,中国 AI 反而越跑越快?答案只有一句话:没有擎天柱,我们就重新设计整车,重新规划道路,重新调度整个交通网络。这不是算力的替代,而是换道超车。


结语
建议特朗普政府不要再搞芯片限制 —— 中国的算力底气,早已在本土企业的努力下,练得十足扎实。
更新时间:2026-06-22
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号