Qwen 上演饱和式开源,一周三发刷新 SOTA,硬刚顶流闭源模型

这周 AI 圈的头条,被 Qwen 持续霸榜,短短一周,Qwen 一口气端出来三道主菜,一份甜点:

这还没完,Qwen 团队已经预告了下周还要继续,暗示会发布 flash 级别的模型,更小、更快、更强。看来这明显是一次「有策划、有预谋」的模型发布,而我只想说:让这样的发布和霸榜,再来的猛烈一点吧!

AI 群里的朋友开玩笑说,现在每天不熬到凌晨不敢睡,以前是怕错过国外的 AI 新闻,现在是怕一觉醒来,Qwen 再次定义 SOTA。

当然,Qwen 并不是有意要熬夜发布,而是真实的 DDL 冲刺。Qwen3-Coder 熬了个通宵,
Qwen3-235B-A22B-Thinking-2507 赶在周五下午下班前发布(这次轮到国外熬夜了)。毕竟,Qwen 的开源可不是简单地点一下上传,而是帮大家做了巨量的上下游 Infra 社区工作。

这波真得 Respect!Qwen 佬们一定要注意休息啊!flash 模型下周二再发布也不晚的!(狗头)

这样的发布节奏已经不只是「卷」能形容的了,想来想去,我觉得可以用「饱和式开源」来形容 Qwen 的工作。

先看最新发布的模型。

距离 4 月底的 Qwen3 发布过去不到 3 个月,Qwen 就发布了这一次「小更新」。这次更新,Qwen3 的混合思维模式重新拆分回对话和推理两个模型,推理思维链的长度扩展到了最长 80k 还多:

在推理模式下,Qwen3-235B-2507 的分数相比于 Qwen3 大幅提升,在 AIME25、LiveCodeBench v6、Arena-Hard 等多个测评集上反超了 Gemini 2.5 Pro 和 o4-mini 等闭源模型:

添加图片注释,不超过 140 字(可选)

这是更详细的分数:

QwenChat 网站上已经更新到了最新的模型版本,可以免费体验:Qwen Chat

对于有条件自己部署的小伙伴,也可以到 HuggingFace 或魔搭获取模型:

卷的尽头还是阿里,为什么大家会选择 Qwen?

除了模型成绩,我今天想多聊一点 Qwen 的开源影响。

昨天有朋友问:「Qwen3 真能对标 Gemini 2.5 Pro 吗?」我回答:「当一个 200B 级别的开源模型,被拉出来跟闭源 SOTA 进行比较的时候,它就已经不输了。」

很多普通用户对 Qwen 体会和感受并不明显,就说我是「千问吹」。我觉得挺荣幸,就是要吹,不吹怎么让 Qwen 有动力继续开源。

我觉得 Qwen 的成功在于做到了:尺寸全、场景全、开发者友好

Qwen 现在是全球衍生模型生态最庞大的基础模型。其实早在 Qwen2.5 时代,Qwen 就已经超越了 llama 的衍生模型数量,位居全球第一。今年以来,Qwen 也在不断巩固了自己开源霸主优势。

在 HuggingFace 上,基于 Qwen 的模型数量已经接近 15 万个,占到整个 HuggingFace 上所有模型的 7.9%。

作为对比,Llama 的衍生模型有 13.5 万个,BERT 有 4.2 万个,Mistral 有 3.5 万个,GPT 有 3.4 万个。

要知道,Qwen 官方也不过才发布了 327 个模型,相当于每个模型都衍生出了成百上千个第三方模型

这说明什么?

说明有海量的开发者在用真金白银的 GPU Hour 投票,自发地基于 Qwen 训练自己的模型。

为什么是 Qwen?

  1. 第一是尺寸全,从 0.6B 到 235B(以及 480B 的 Coder 模型),Qwen3 覆盖了几乎所有场景,且在每个尺寸上都能接近 SOTA 成绩。
  2. 第二则是场景全,除了文本模型,Qwen 还陆续开源了视觉模型、TTS 模型等多模态模型。
  3. 更重要的则是开发者友好。相比于有些模型只扔个权重,开发者要自己想办法适配框架,量化、踩坑。Qwen 的开源更像是「交钥匙工程」,省心省时省力。

Qwen 的每次发布,社区都会第一时间积极响应。HuggingFace、vLLM、Ollama、LMStudio 这些全球主流的工具和社区,几乎都能在第一时间完成兼容支持。这不是巧合,而是千问团队在模型发布前,投入了巨大精力去一个一个对接、调试、优化的结果。

这种对开发者关系的极致重视,让每个拿到 Qwen 模型的人都能立刻用起来,而不是对着一堆文件干瞪眼。

毫不夸张地说,学术界、产业界现在相当程度都在靠 Qwen 的基础模型做科研、做落地。高校的朋友跟我开玩笑说,组里有几个研究生,就指望 Qwen 的小模型基座毕业呢。

所以说,Qwen 的开源工作是最彻底、最扎实的,因而才能吸引到更多开发者,共同构建开放、繁荣、人人可用的技术生态。

国内开源 vs. 国外闭源,悄然发生的格局之变

如果我们再把视线拉远一点,会发现一个更大的竞争格局正在悄然改变。

大模型火了以后,美国一直是 AI 风向标。一年前,OpenAI 领跑模型和产品范式,Meta 是开源扛把子。但是现在,事情正在发生变化。

在国外的顶流巨头们走向「闭源保守」时,以 Qwen 为首的中国力量,扛起了开源的大旗。

这种悄然发生的战略反转说明,中国企业不再是先进技术的追随者和使用者,而是正在成为全球 AI 开源生态的「基础设施提供者」和「游戏规则制定者」。

所以我们看到,越来越多的国外开发者选择了 Qwen,成为 Qwen 的自来水:

这,就是这场技术竞赛中,属于中国开源力量的阳谋。

小结:开源定义未来,Qwen 已手握船票

总而言之,这周 Qwen 的三连发,意义远大于模型本身。

对于中小企业和开发者来说,创新的门槛,从未如此之低。曾经需要付出高昂成本的顶尖 AI 能力,现在触手可得,真正向着科技平权、AI 普惠迈进

放眼全球,当硅谷巨头们在开源与闭源的十字路口犹豫徘徊,甚至出现战略倒退时,以 Qwen 为代表的中国 AI 力量,用最坚决的行动给出了自己的答案:

最彻底的开放,就是最坚固的护城河。

下一个时代,或许真的将由开源定义,而手握最强性能、最全矩阵、最大生态的通义千问,已经稳稳拿到了那张驶向未来、问鼎全球的,最重要的船票。

展开阅读全文

更新时间:2025-07-29

标签:科技   和式   模型   周三发   开发者   全球   分数   场景   尺寸   生态   性能   国外

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top