你有没有想过,当全球数百万开发者每天打开电脑写代码的时候,他们身边站着的"AI助手"到底是谁?
最近,我盯着OpenRouter发布的一组真实数据看了很久。OpenRouter(
https://openrouter.ai/rankings)是全球最大的AI模型路由平台之一,开发者通过它调用各家大模型的API——这意味着它的数据不是实验室跑分,不是PR稿,而是真金白银的实际使用量。
这组数据告诉了我一个让我有点震惊的故事。
先看一个最直观的数字:从2025年5月到2026年4月,OpenRouter平台每周的AI调用总量,从不到5T tokens增长到了接近28T tokens。

T是万亿的意思。28T tokens,大概相当于几千亿个汉字的处理量,每周。
更关键的是这个增长的形状——它不是线性的,而是一条指数曲线。2025年11月之前,增长相对平稳;但从2025年12月开始,曲线突然向上折,像一支箭射出去。半年时间,用量翻了将近5倍。
这意味着什么?它意味着AI已经不再是"少数人在玩的新鲜玩意儿"。大规模的商业部署正在发生,AI正在成为软件开发流程里真实的基础设施,就像云服务器、数据库一样不可或缺。
这一波浪潮的主力,是Coding Agent——专门用来写代码、改代码、审代码的AI智能体。
OpenRouter单独整理了一份Coding Agents Rankings,这是我认为这组数据里最值得深思的部分。

Hermes Agent以436B tokens排名第一,它是Nous Research开发的开源、自我改进型AI Agent,能持续运行、自主完成任务。

紧随其后的是OpenClaw(184B)和Kilo Code(160B),两者都是开源项目,分别主打消息应用集成和跨IDE的编程辅助。
有趣的是,Lemonade排第6,它的介绍只有一句话:"The AI tool for Roblox games"——一个专门服务Roblox游戏开发者的垂直工具,token消耗量超过了很多通用编程助手。这说明垂直场景的AI工具正在形成自己的规模效应。

从趋势图来看,整个Coding Agent赛道的周用量从2025年5月的不到1T tokens,增长到2026年5月11日这周的4.6T tokens,增长了将近5倍。而且这个增长还在加速——最近几周的柱子明显比之前更高。
一个产品经理的判断: Coding Agent不是未来,它是现在。如果你的团队还没有把AI编程工具纳入正式的开发流程,你已经在输了。
回到大模型本身的竞争。流量榜Top 10里,有一个让我反复确认的事实:中国模型占据了至少5个席位。

腾讯的混元模型Hy3 preview以2.76T tokens排名第一,增长率153,299%——这个数字背后是一次近乎垂直的爆发式崛起。DeepSeek一家就有三个版本进入前10(V4 Flash第2、V3.2第7、V4 Pro第8),月之暗面的Kimi K2.6排第5。
与此同时,OpenAI在Top 10中完全缺席。这句话值得再读一遍:曾经几乎垄断整个AI API市场的OpenAI,在这份真实使用量的榜单里,Top 10里找不到它的影子。GPT-5.5在流量榜上排第18,GPT-5 Codex排第20。
当然,这不代表OpenAI不重要——它在智能指数基准上仍然以60.2分排名第一,是目前公认能力最强的模型之一。但"最聪明"和"最受欢迎"之间,存在一道真实的鸿沟。

市场份额的数字更能说明问题: Anthropic(16.3%)、Google(14.8%)、DeepSeek(14.6%)三足鼎立,OpenAI只有9.8%。而中国厂商加总——DeepSeek、腾讯、阿里Qwen、月之暗面、MiniMax、智谱——合计超过37%的全球市场份额,是OpenAI的将近4倍。
这不是民族主义情绪,这是真实的市场数据。
最后一张图是Context Length分布,这是一个很容易被忽视但对产品设计极其重要的维度。

这张图统计的是1K~10K tokens这个区间的请求量,也就是"短到中等长度"的对话。从2025年11月到2026年5月,这个区间的请求总量从不到500M/周增长到超过1.4B/周,同样是近3倍的增长。
在这个区间里,Google的Gemini 2.5 Flash Lite以8.8%排名第一,Gemini 2.5 Flash(7.1%)和Gemini 3 Flash Preview(5.9%)紧随其后——Google三个版本加起来占了将近22%的短上下文请求量。DeepSeek V3.2排第4,DeepSeek V4 Flash排第6。
这背后的逻辑很清晰:短上下文场景是高频、高并发的,比如代码补全、快速问答、实时翻译。这类场景对速度和价格极度敏感,对模型的"最高智商"要求反而没那么高。Google的Flash系列在这个赛道上的统治力,说明它在"快、准、便宜"这个产品定位上做得非常成功。
一个产品经理的洞察: 不要以为上下文窗口越长越好。对于大多数真实的生产场景,1K~10K tokens才是主战场。在这个区间做到极致,才是真正的商业价值。
把所有图综合来看,我想说三件事。
第一,AI基础设施的"水电煤"时代已经到来。 开发者不再问"要不要用AI",而是在问"用哪个AI、在哪个场景用、用多少"。这就像当年云计算的普及——不是一夜之间发生的,但当你意识到的时候,它已经是基础设施了。
第二,"最聪明"和"最好用"是两回事,而且差距正在拉大。 GPT-5.5是目前智能指数最高的模型,但它在流量榜上排第18。Hy3 preview流量第一,但它甚至没有出现在智能指数榜单上。开发者选择模型,看的是性价比、速度、稳定性、生态集成——而不只是跑分。这对所有做AI产品的团队都是一个警醒。
第三,Coding Agent是这波AI浪潮里最值得押注的应用方向。 它不是一个功能,而是一个新的人机协作范式。当Hermes Agent可以"持续运行、自我改进",当Kilo Code可以跨越VS Code、JetBrains、CLI无缝工作,我们谈论的已经不是"AI帮你写代码",而是"AI和你一起开发软件"。这个范式的渗透率,才刚刚开始。
AI的故事,比大多数人想象的更快、更复杂、也更精彩。
这场战争没有终局,但现在的数据已经在告诉我们:赢家不一定是最聪明的那个,而是最快被真实用户选择的那个。
这,才是市场的逻辑。
数据来源:OpenRouter LLM Leaderboard & Coding Agents Rankings,截至2026年5月
附排行榜链接:
https://openrouter.ai/rankings
=========本文完==========
公众号:BLUES,12年原创公众号,作者兰军,AI产品创业者,原腾讯高级产品经理、YY语音高级经理、迅雷产品总监、梅沙科技创始合伙人等,20多年丰富的职场经历,连续创业者,AI产品与企业咨询、培训顾问。
更新时间:2026-05-19
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号