Anthropic推了Claude4.5,DeepSeek更了V3.2,OpenAI不光上线Sora2,还入股了AMD,连DevDay都办了,要搞AI操作系统。
结果蚂蚁更猛,9月30号直接开源全球首个万亿参数推理大模型Ring-1T-preview,10月9号又甩出旗舰非思考模型Ling-1T。
十天时间,国内万亿参数俱乐部原来就KimiK2、Qwen3-Max两家,现在直接变成三家。
说实话,这节奏快得让人有点反应不过来,感觉蚂蚁是憋着一股劲,要在Q4一开始就定调。
先说说这俩模型的“硬实力”,本来想觉得万亿参数只是个噱头,后来发现还真不是。
这两款模型都用了蚂蚁自研的Ling2.0架构,训练时用的语料库超20T,里面全是高质量内容,比不少同行的10-15T语料规模多了不少。
语料多不多,直接影响模型理解深度,这点懂行的都清楚。
再看实际能力表现,官方放了横评数据,Ling-1T跟DeepSeek-V3.1-Terminus、Kimi-K2-Instruct-0905这些国内外主流模型比,在代码生成、软件开发、竞赛数学这些推理测试里,大部分项目都领先。
Ring-1T-preview更厉害,作为思考模型,纯自然语言推理能力快追上GPT-5withthinking(还不用工具),尤其是在CodeForces这种竞赛级代码生成任务里,直接拿了最高分。
CodeForces这榜单可不是闹着玩的,之前长期被GPT-4o、Claude4这些海外模型霸占,国内模型能登顶,还是挺提气的。
现在蚂蚁还在测ICPC、CCPC这些更难的编程竞赛,想把这模型的潜力再挖挖。
老实讲,之前总听人说国内大模型在高端推理上不如国外,这次蚂蚁算是用数据反驳了一把。
讲完模型本身,再回头看发布节奏,其实蚂蚁早有准备,今年5月27号的技术日上,百灵团队就说在练一个Max级模型,要等能力比肩DeepSeek再发。
四个月后这俩模型落地,也算兑现了当时的说法,如此看来,蚂蚁不是临时起意,而是早就规划好了路线,就等技术成熟再亮牌。
很多人疑惑,现在行业里不少人都说ScalingLaw遇到瓶颈了,参数再大也难提升能力,蚂蚁为啥还能搞出万亿模型?这里就得提蚂蚁的“非共识”观点,百灵团队负责人周俊说,Scaling这事儿还没终结。
支撑这个观点的,是蚂蚁自己搞的两项技术,一个是LingScalingLaw,能自动算最优参数配置,还能精准外推预测,帮团队选架构,就算计算量巨大,架构效率也能保持住,另一个是WSM调度器,替代了传统的WSD调度器。
之前传统调度器在参数超5000亿后,训练损失值波动能超15%,不稳定得很,WSM调度器通过Merge阶段平滑整合参数,把波动控制在5%以内,训练效率还提了不少。
这俩技术可不是花架子,Ring-1T和Ling-1T能做到万亿参数,全靠它们。
很显然,蚂蚁不是盲目堆参数,而是有技术支撑的,这跟那些只追求参数数字的做法不一样。
而且蚂蚁还解决了万亿模型的一个大痛点,能耗,本来想觉得参数越大,能耗肯定越高,中小企业根本用不起。
后来发现蚂蚁让模型保持了高稀疏性,就说Ling-1T,每个token只激活51B参数,再加上“中训练+后训练”的Evo-CoT,推理效率提上去了,能耗却降成了百亿级水平。
搞不清那些还在为高能耗头疼的企业,会不会参考蚂蚁这招,毕竟能让中小企业用得起万亿模型,才是真的推动行业进步。
有了技术和低能耗,蚂蚁的布局还不止于此,它还搭了个百灵大模型家族,分工特别明确:Ling是基础大语言模型,Ring管推理,Ming做多模态,还分视频、音频子系列。
尺寸也全,从10B到1T,有mini、flash、lite版本,比如16B的Ring-mini-2.0,2.8B的Ming-lite-omni。
Ming-lite-omni挺有意思,是社区少有的全模态模型,2.8B激活参数就能比肩GPT-4o,现在在HuggingFace下载量都超50万次了,比同类中小参数模型火多了。
不同尺寸对应不同场景,1T级服务金融、工业这些核心领域,10-100B级给中小企业做客服、内容生成,10B以下的嵌到智能硬件里,覆盖得特别全。
更关键的是蚂蚁的开源策略,它所有模型都是“真开源”,没有等待期,核心代码都开放。
在HuggingFace的InclusionAI里,14个collection加数十个工具,涵盖了好几个技术领域。
现在已经有200多家企业基于这些开源模型二次开发了,这比那些搞“半开源”“有等待期开源”的企业实在多了。
蚂蚁CEO韩歆毅说过,做基础大模型是为了追求智能上限,支撑更好的AI应用。
如此看来,开源就是让生态帮着迭代模型,开发者反馈能补漏洞,企业二次开发能拓展场景,双向赋能,挺聪明的。
另外蚂蚁还同步推了Agent产品,三大AI管家,AQ、蚂小财、AI生活管家,AQ有独立APP,蚂小财嵌在蚂蚁财富里。
本来想觉得这就是普通的“AI+传统功能”,后来发现蚂蚁是按“AI原生”来做的,把它们当新物种,不是简单加个AI模块。
就说蚂小财,上线三个月,帮500多万用户做理财建议,用户收益率比行业平均高不少,这说明模型能力真的落地了。
还有“百宝箱”平台,能聚合调度多智能体,再加上InclusionAI社区,蚂蚁这是从模型到产品再到生态,全链路都铺好了。
如此看来,蚂蚁这波不是单纯发两个模型,而是把自己的AGI路线图亮了出来。
深耕超大参数模型、拥抱开源、做Agent产品,都是为了推智能上限、找场景落地。
对整个AGI生态来说,这不仅是多了两个万亿模型,更打破了“ScalingLaw遇瓶颈”的固有认知,给国内AI企业指了另一条路。
以后开发者和企业,既能低成本用万亿模型,又能基于国产模型做应用,说不定国内AI行业的格局,都会因为蚂蚁这波操作而变一变。
更新时间:2025-10-13
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号