DeepSeek发布全新开源版本R1,性能直追OpenAI顶级o3模型!

昨天凌晨,全球知名的开源大模型平台DeepSeek发布了其R1系列的最新0528版本。该版本尚未伴随详细说明,仅以低调的方式对外开放。预计很快DeepSeek将发布官方模型卡,详细介绍新版本的功能和特点。


开源地址:
https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main

不过,已有用户急于体验新版R1,并进行了测试。在知名代码评测平台Live CodeBench上,R1的表现被认为能够与OpenAI最新高版本的o3模型相提并论。

部分用户对新版R1的风格进行了对比测试,发现其表现几乎与OpenAI的o3模型相当。R1-05-28在回应中展现出了类似于o3-2.5专业风格的特征,诸如箭头和星号的使用与o3风格高度一致,且在结尾部分以“why it works”的表述增加了说服力。尽管OpenAI付出了很多努力,DeepSeek仍成功实现了这一目标。如果这已经达到了o3的水平,那么未来的R2版本将会更加智能,令人期待。


Hyperbolic Labs的联合创始人兼CEO表示,新版R1依然是唯一能够正确回答9.9和9.11哪个更大的模型。



知名AI评论员Haider表示,大师兄DeepSeek强势回归。新版DeepSeek R1在编程能力上表现非常出色。他曾进行过一个编程挑战,要求模型创建一个单词评分系统。经过短暂推理后,模型生成了两个文件:一份结构清晰的代码和一份可执行的测试用例,且这些测试用例首次运行就全部通过。此前只有o3模型能够达到这样的水准,而现在没有其他模型能够超越。这是他在该任务中遇到过的表现最优的模型。


我持续对它进行测试,发现它表现非常出色,不过目前响应速度似乎有所放缓,思考时间变长了。

如果其他基准测试能证实这一点,我猜测DeekSeek本来打算将新版R1命名为R2发布。不过,鉴于他们最近推出的产品已经遥遥领先,直接用R2这个名称可能会让用户产生过高期待,难免会感到失望。因此,他们可能选择将这个版本继续作为全新的R1发布。现在的问题是,我们还需要等待多久才能见到真正意义上的R2版本。


最新的DeepSeek R1表现相当出色。它现在具备了像o3那样修正自身思考过程(CoT)的能力,同时也能够像Claude一样富有创造性地构建完整的世界观。这些是在之前的R1版本中无法实现的功能。

看到新版R1在编程方面表现如此出色,令我感到非常惊讶。用相同的提示测试了最新的Opus 4,结果发现Opus 4仅仅略微领先一些。这个差距令人感到颇为震撼……


·


我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。


欢迎关注“福大大架构师每日一题”,让AI助力您的未来发展。

·

展开阅读全文

更新时间:2025-06-04

标签:科技   模型   性能   版本   新版   测试   出色   最新   风格   发现   用户   知名

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top