6%的成本干翻顶流?排名出炉,唯一进前十五的国产大模型是它

在阅读文章前,辛苦您点下“关注”,方便讨论和分享。作者定会不负众望,按时按量创作出更优质的内容。

文I李Lin环球

编辑I李Lin环球

前言

朋友们,最近AI圈出了个事儿。

就在4月30号,那个被称为“大模型界奥林匹克”的LMArena竞技场更新了最新排名。

6%的成本干翻顶流

这个平台不像有些评测那样对着固定题库刷分,它玩的是盲测——用户同时看两个匿名模型的回答,纯粹凭质量投票。所以这分数里头的“水分”,基本拧不出来。

结果你猜怎么着?百度的文心5.1 Preview,直接砍下1476分,登顶文本榜国内第一,把GPT-5.5、DeepSeek-V4-Pro这些平时耳熟能详的名字全给超了。

更硬气的是,放眼全球前十五名,就它一根国产独苗在那儿立着。同台竞技的都是谁? Claude Opus 4.7、Gemini 3.1 Pro、Grok,哪个不是响当当的国际顶流?文心5.1这一波属于正面硬刚,没搞什么田忌赛马的套路。

那问题来了,凭啥突然就冲上去了?我翻了翻资料,发现这事儿还真不是临时抱佛脚。核心原因得追溯到文心5.0那会儿搞的一个叫“多维弹性预训练”的技术。

这名字听着挺拗口,说人话就是:以前训练不同尺寸的模型,得分别练好几次,相当于做一桌子菜每道都得单独烧。现在这个技术实现了一次训练就能生出多种规格的模型,堪称“一鱼多吃”的典范。

文心5.1 Preview就是这个技术路线的产物。效果有多夸张呢?它的预训练成本只有业界同规模模型的6%左右。

百分之六什么概念?别人花100块才能干成的事,它6块钱搞定,效果还领先。这性价比,搞得我都有点心疼那些烧了几亿美金训练的同行了。

目前这个预览版已经上了百度千帆模型广场,企业和开发者可以去申请邀测体验。不过更多人盯着的是正餐——随着Create 2026百度AI开发者大会定档5月13日在北京开幕,传闻文心5.1的正式版大概率会在会上亮相。

稍微回顾一下背景就明白这其中的分量:文心大模型从2019年首秀到现在,去年底发布的5.0版参数规模已经干到了2.4万亿,能同时处理文字、图片、音频、视频。

这次5.1要是再往上拱一步,那可不只是版本号跳个数字那么简单。

说白了,这不叫简单的软件升级,这是国产大模型在全球牌桌上的一次关键抢位。以前咱们总觉得这方面差口气,现在人家用实打实的榜单排名告诉你:别老觉得外国的月亮比较圆,咱自己的技术也开始有模有样了。

而且你细品,6%的成本跑出领先效果,这意味着什么?意味着不靠堆显卡、不靠烧钱,也能走出一条自己的路。这个路子要是走通了,对整个行业的影响,可能比拿个榜单第一更大。

当然,预览版到正式版还有一段路,到底能进化成啥样,咱们5月中旬见分晓。

反正看完这个成绩单,我反正先给国产大模型鼓个掌——卷得好,继续卷,光明正大地卷。

结语

这波国产大模型在LMArena上的表现,说白了就一句话:用更少的资源,打出了更漂亮的数据。6%的成本撬动全球前十五,这事儿放在两年前恐怕没几个人敢想。技术路线一旦走通了,后续的想象空间远比一个榜单排名大得多。

当然,预览版到正式版还有变数,咱们不急着下定论。但有一点是清楚的——国产大模型,已经不再是跟在后面跑的选手了。

展开阅读全文

更新时间:2026-05-06

标签:科技   模型   成本   正式版   技术   环球   效果   说白了   开发者   多维   奥林匹克

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top