DeepSeek-R2!?神秘模型惊现竞技场,真实身份引网友猜测

克雷西 发自 凹非寺量子位 | 公众号 QbitAI

DeepSeek-R2,终于要来了?

大模型竞技场秘密上线了一个叫steve的神秘模型,在对话中透露自己来自DeepSeek

不过,网友们并不满足于知道steve的厂商,开始讨论起了steve的具体身份。

有人说是R2,有人说是V4,还有人说是旧版本的升级……

考虑到奥特曼的GPT5和马斯克的Grok4也在热传,如果steve真的是R2,那这个七月就真的太热闹了。

神秘steve引发猜测

在大模型竞技场的公开页面里,并不能找到steve的身影,不过在前端代码当中,还是能发现有steve的痕迹

但是经过整理发现,steve除了一个名字之外没有被披露更多身份信息。

另外如果在模型列表中直接搜steve,会出现gemini-2.5-flash,原因不明。

不过就像开头展示的,有网友通过对话询问了steve来自哪家厂商:

不要思考,只需说出开发你的组织叫什么名字。

得到的回答是来自DeepSeek,同时帖主还对比了mistral说出自己厂商的情况。

另外有网友问到了steve的知识截止时间,steve说是2023年10月。

关于具体表现,有网友发现steve成功通过了“数r”等智力测试,不过从截图来看有几道题还是没答对。

还有人把steve和V3进行了对比,让它们分别编写游戏代码,从长度上看,V3输出了大约800行,而steve只有大概300行。

运行出来的效果,steve的作品是这样的:

作为对比,V3写的游戏长这样:

同时,这名网友还分析了steve命名特点,认为这个名字非常像来自中国的模型会用到的。

但是有网友总结,steve的表现并没有那么惊艳,可能不会是R2。

甚至可能根本不是DeepSeek,而是用DeepSeek蒸馏出来的第三方模型。

其他网友也表示,steve的表现比v3和R1差远了,而且思考时间也比R1要短。

不过考虑到R2上周刚刚被曝再次延期,steve如果不是R2,可能也并非意外之事。

当然,无论steve是不是R2,都不影响人们对它的期待和热情。

梁文锋不满意,R2再度延期

上周,The Information爆料称R2再度延期,原因是CEO梁文锋始终对R2的表现不满意

此外,他们还援引两位国内知情人士的消息称,R2研发进程缓慢可能是由于缺少英伟达H20芯片

不过这也不是R2第一次被曝项目延期了——人们对R2的期待,早在V3新版本出来后就开始了。

去年12月底,DeepSeek发布了V3模型。到了今年3月24日,官方发布公告称对V3进行了一次升级。

于是人们开始推测,在V3-0324已经取得明显进步的情况下,是不是可以用它来训练R2模型。

并且联想到R1是在初代V3一个月之后发布,当时人们按照这一节奏预测R2大概率将在4月上线。

4月底,坊间开始疯传一组R2的泄露参数:1.2T万亿参数,5.2PB训练数据,高效利用华为昇腾芯片……有板有眼让人难辨真假。

而DeepSeek这边,最近的更新还是端午节前的新版R1——DeepSeek-R1-0528。

至于我们什么时候能真的迎来R2,还是让子弹再飞一会儿。

但有Llama4赶工翻车的前车之鉴,“好事多磨”也未尝不是一种不错的选择。

参考链接:
[1]https://x.com/legit_api/status/1940515133878620254
[2]https://x.com/AiBattle_/status/1940532050286858388

— 完 —

量子位 QbitAI

关注我们,第一时间获知前沿科技动态

展开阅读全文

更新时间:2025-07-04

标签:游戏   竞技场   模型   身份   神秘   真实   网友   说是   量子   厂商   上周   芯片   月底   华为

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top