DeepSeek发布全新开源版本R1，性能直追OpenAI顶级o3模型！

昨天凌晨，全球知名的开源大模型平台DeepSeek发布了其R1系列的最新0528版本。该版本尚未伴随详细说明，仅以低调的方式对外开放。预计很快DeepSeek将发布官方模型卡，详细介绍新版本的功能和特点。

开源地址：
https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main

不过，已有用户急于体验新版R1，并进行了测试。在知名代码评测平台Live CodeBench上，R1的表现被认为能够与OpenAI最新高版本的o3模型相提并论。

部分用户对新版R1的风格进行了对比测试，发现其表现几乎与OpenAI的o3模型相当。R1-05-28在回应中展现出了类似于o3-2.5专业风格的特征，诸如箭头和星号的使用与o3风格高度一致，且在结尾部分以“why it works”的表述增加了说服力。尽管OpenAI付出了很多努力，DeepSeek仍成功实现了这一目标。如果这已经达到了o3的水平，那么未来的R2版本将会更加智能，令人期待。

Hyperbolic Labs的联合创始人兼CEO表示，新版R1依然是唯一能够正确回答9.9和9.11哪个更大的模型。

知名AI评论员Haider表示，大师兄DeepSeek强势回归。新版DeepSeek R1在编程能力上表现非常出色。他曾进行过一个编程挑战，要求模型创建一个单词评分系统。经过短暂推理后，模型生成了两个文件：一份结构清晰的代码和一份可执行的测试用例，且这些测试用例首次运行就全部通过。此前只有o3模型能够达到这样的水准，而现在没有其他模型能够超越。这是他在该任务中遇到过的表现最优的模型。

我持续对它进行测试，发现它表现非常出色，不过目前响应速度似乎有所放缓，思考时间变长了。

如果其他基准测试能证实这一点，我猜测DeekSeek本来打算将新版R1命名为R2发布。不过，鉴于他们最近推出的产品已经遥遥领先，直接用R2这个名称可能会让用户产生过高期待，难免会感到失望。因此，他们可能选择将这个版本继续作为全新的R1发布。现在的问题是，我们还需要等待多久才能见到真正意义上的R2版本。

最新的DeepSeek R1表现相当出色。它现在具备了像o3那样修正自身思考过程（CoT）的能力，同时也能够像Claude一样富有创造性地构建完整的世界观。这些是在之前的R1版本中无法实现的功能。

看到新版R1在编程方面表现如此出色，令我感到非常惊讶。用相同的提示测试了最新的Opus 4，结果发现Opus 4仅仅略微领先一些。这个差距令人感到颇为震撼……

我们相信人工智能为普通人提供了一种“增强工具”，并致力于分享全方位的AI知识。在这里，您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。

欢迎关注“福大大架构师每日一题”，让AI助力您的未来发展。

展开阅读全文

更新时间：2026-02-11

标签：科技模型性能版本新版测试出色最新风格发现用户知名

1 2 3 4 5

DeepSeek发布全新开源版本R1，性能直追OpenAI顶级o3模型！

三星One UI ClockFace模块将新增多个锁屏时钟样式

联合国：加沙遭遇本轮冲突以来“最糟糕的灾难性局面”

90岁爷爷卖5毛钱粽子30年不涨价

江淮汽车获融资买入3.35亿元，居两市第9位

脑洞大开：用核能蒸粽子 1小时能熟多少个?

“当国宝遇见国货”，四川长虹618演绎“科技＋文化”

长和事件不能重演，美企报价10亿收购达尔文港，遭到中企一口回绝

美国终于动手，27万中国学生，可能被无情遣返，中方警告两大后果

油价还要继续跌？OPEC+连续第三次大幅增产，同意7月将石油产量提高41.1万桶/日

联合国爆财政危机，美方拖欠15亿，中国也延迟缴费，原因有所不同

欧债收益率普跌，英国10年期国债收益率跌0.1个基点

联合国：加沙正沦为“全球最饥饿之地”，以色列持续封锁致援助陷入瘫痪

韩志强大使辞行拜会泰国国会主席万诺

玉渊谭天丨为何发言总关联中国？美防长的回答意味深长

农发行官宣：迎新党委副书记！

“当国宝遇见国货”，四川长虹618演绎“科技＋文化”

知名机构出现大规模兑付异常！“存的黄金提不出来，也无法

你发现没？今年端午还没到，就出现了3大怪现象！与往年大不

2025年衡阳市科技活动周在南岳启动进一步提升全民科

2025年山西林草科技活动周在太原启动

长虹美菱获得外观设计专利授权：“电子设备的洗涤程序控

知名男演员被爆心肌炎发作！本人发文回应

热搜第一！瑞幸降价到“6块9”？官方最新回应来了

知名品牌咖啡降价，冲上热搜！迈入“6块9”时代

2025年衡阳市全国科技工作者日主场活动举办陈澎致辞