英伟达H20芯片禁售对DeepSeek产生了显著影响。
按照原计划,DeepSeek将在2025年5月推出R2模型,这是一款拥有1.2万亿参数的混合MoE架构模型,其单token推理成本需降低97.3%。但由于H20断供导致的算力不足,研发进度严重受阻。内部消息透露,R2模型发布被迫推迟。
与此同时,研发延迟进一步导致市场热度下滑。云厂商因算力短缺,延长了新客户接入审核周期,这使得DeepSeek的模型测试与部署进程放缓。
从数据上看,2025年第二季度,DeepSeek的使用率从年初的50%骤降至3%。训练数据质量不足导致R2模型“幻觉问题”频发,生成虚假信息的情况严重,这极大地削弱了用户对其的信心。
许多客户纷纷转向阿里Qwen3、腾讯混元Turbo等替代模型,DeepSeek面临着严峻的用户分流困境。对DeepSeek而言,算力短缺如同扼住了发展的咽喉。
在寻求国产替代方案的过程中,企业又面临着诸多难题。
虽然昇腾910B等国产芯片性能与H20接近,但良品率低、交付周期长,在2025年第二季度,国产芯片仅占数据中心加速卡市场的20%,并且多应用于推理场景,训练能力不足。
不仅如此,软件生态迁移成本也十分高昂。
从英伟达的CUDA生态迁移至国产昇腾MindSpore,企业需要额外投入约20%的适配成本,大约3000万元/企业。
DeepSeek所依赖的PyTorch框架,国产芯片对ONNX等通用框架支持不足,企业不得不重构代码,这无疑增加了企业负担。部分头部企业采用“H20推理+昇腾训练”的混合算力方案,虽然成本降低了60%,但任务流的拆分使得系统复杂度大幅提升,对于像DeepSeek这样的全栈开发者而言,并不友好。
好消息是,7月15日,英伟达CEO黄仁勋宣布,美国政府已批准H20芯片销往中国。
这一消息让国内相关企业看到了曙光。此前积压的180亿美元订单将重启交付,DeepSeek的算力瓶颈将得到部分缓解,这有望推动R2模型在2025年下半年发布,甚至可能在WAIC大会上亮相。
但是不能忽视长期存在的风险。
美国可能会进一步推出性能再降25%的B30芯片,试图延续技术代差策略。不过,国产芯片也在加速发展,例如昇腾920预计在2025年底量产,算力可达500TFLOPS,寒武纪也在通过价格战推动市场份额增长,如MLU370价格降至8万元,这都有助于构建自主的算力生态。
总体来看,H20芯片禁售给DeepSeek等国内AI企业带来了阶段性阻碍,但也在一定程度上加速了国产算力生态的完善。
短期的阵痛或许是迈向长期技术自主的必要代价,而H20芯片的解禁,仅仅是全球化供应链博弈中的一次短暂喘息,未来中国AI企业仍需不断提升自身技术实力,才能在国际竞争中站稳脚跟。
更新时间:2025-07-18
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号