华为云发布盘古大模型5.0

从神话里借来的名字

华为给自家的大模型起名盘古,这个选择本身就挺有意思,盘古是中国神话里开天辟地的神,用这个名字,暗示的野心不言而喻。

2021年盘古大模型第一次发布的时候,国内做大模型的公司还不多,大家的注意力都在国外的GPT身上。

三年过去,大模型赛道已经挤满了玩家,盘古也迭代到了第五代,这次5.0版本的发布,华为云没有搞那种特别宏大的发布会,但放出来的技术细节足够让业内人士认真看一看。

跟通用模型的差异化路线

盘古从一开始走的就不是纯通用路线,OpenAI的GPT系列是做一个什么都懂的模型,你问什么它都能答,华为的思路不太一样,他们更倾向于针对特定行业做深度优化,金融,制造,矿山,气象,医药,这些方向都有专门的行业模型。

这种策略的好处是落地快,企业客户拿来就能用,不需要自己再花大量时间做微调,坏处是通用能力上可能不如那些专门做基座模型的公司,5.0版本在这个基础上做了升级,行业模型的数量增加了,同时基础能力也有提升,长文本理解,多模态处理,代码生成这些方面都有改进。

一个气象预测的例子

说到盘古在行业里的应用,有个例子经常被提起,去年他们跟国家气象局合作,用盘古气象大模型做台风路径预测,据说精度超过了传统的数值预报方法。

气象预测这件事,以前主要靠超级计算机解物理方程,算力消耗巨大,预测一次需要几个小时,用大模型之后,预测时间缩短到几分钟,而且准确率还提高了,这个案例被华为反复讲,因为它很好地说明了行业大模型的价值,不是取代人,而是把原来做不到或者做不好的事情变得可行。

5.0版本的新东西

这次5.0版本有几个值得关注的技术点,一个是多模态能力的强化,不仅能处理文本,还能理解图像,视频,雷达信号这些不同类型的数据。

这在工业质检,自动驾驶这些场景里很有用,因为真实世界的信息本来就是多模态的,另一个是长文本处理能力,现在支持百万字级别的上下文,这对于需要阅读大量文档的工作,比如法律合同审查,医学文献分析,意义很大。

还有一个是模型效率的优化,同样的能力,推理成本更低,这对企业客户来说直接关系到能不能大规模用起来。

华为云的算盘

华为云在大模型这件事上的布局,不能孤立来看,他们有自己的芯片,昇腾系列AI处理器,有自己的框架,MindSpore,现在又有自研的大模型。

这一套东西组合起来,形成了一个相对完整的闭环,企业客户如果选华为云的大模型服务,从算力到模型到工具链都是一家提供的,集成成本会低一些。

这种垂直整合的能力,在国内云厂商里算是独一份,当然,这也意味着客户会被锁定在华为的生态系统里,这是一个需要权衡的地方。

竞争格局的变化

国内大模型市场现在的格局还在快速演变,百度,阿里,腾讯都有自己的大模型,创业公司里也有几家做得不错的,比如智谱,月之暗面。

华为的优势在于B端客户的信任度和行业know-how的积累,劣势是在C端的影响力相对弱一些,普通消费者知道盘古的人不多,5.0版本的发布,某种程度上是在强化自己的长板,把行业大模型这件事做得更深更透。

接下来的看点

大模型技术本身还在快速迭代,今天的领先不代表明天的优势,盘古5.0发布之后,真正的考验在于有多少企业愿意真金白银地用起来,用起来的效果怎么样,能不能产生实际的业务价值。

这些问题的答案,会比发布会上的参数更有说服力,华为云接下来要证明的,不只是技术能力,还有把技术变成商业价值的能力。

展开阅读全文

更新时间:2026-04-06

标签:科技   盘古   华为   模型   能力   行业   版本   客户   气象   技术   国家气象局

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top