梁文峰在《自然》发表封面论文 DeepSeek成首个严格学术审查大模型

中国杭州AI初创公司DeepSeek开发的R1模型近日在《自然》杂志发表了同行评议版本，成为首个经过严格学术审查的主要大语言模型。DeepSeek 创始人兼 CEO 梁文峰为该论文的通讯作者。《自然》杂志不但将该篇论文作为封面论文，还在评论报道文章中用“里程碑式论文揭示 DeepSeek AI 模型的秘密”

这一里程碑式事件不仅揭示了该公司如何以仅29.4万美元的训练成本创造出震撼全球AI产业的模型，更重要的是，它为整个人工智能行业树立了透明度和科学严谨性的新标准。

今年1月，当DeepSeek R1模型发布时，其卓越的推理能力和极低的开发成本瞬间引发全球科技股大幅下跌，纳斯达克指数单日暴跌超过3%，英伟达等AI龙头企业市值蒸发数千亿美元。如今，随着经过同行评议的正式论文发布，这家中国公司的技术路径得到了学术界的认可，同时也为其创新方法提供了更可靠的科学依据。

论文链接：https://www.nature.com/articles/s41586-025-09422-z

突破性的强化学习方法改写AI训练范式

DeepSeek R1的核心创新在于采用了"纯强化学习"这一自动化试错方法。与传统依赖人工标注推理示例的训练方式不同，R1通过奖励模型达到正确答案的行为来学习推理策略，而非模仿人类预设的推理模式。这种方法使模型能够自主发展出诸如自我反思、验证和动态调整等高级推理能力。

俄亥俄州立大学AI研究员孙欢表示，DeepSeek的这一创新"在研究界极具影响力"，并指出"2025年迄今为止几乎所有在大语言模型中进行强化学习的工作，都可能在某种程度上受到R1的启发"。

为提升效率，DeepSeek还采用了一种名为"群体相对策略优化"的技术，让模型自我评估尝试结果，而非依赖独立算法进行评分。这些技术创新使得R1不仅在推理任务上表现卓越，在成本控制方面也实现了突破。

根据《自然》杂志论文的补充材料首次披露，R1的训练成本仅为29.4万美元，加上构建基础模型的约600万美元，总投入远低于竞争对手动辄数千万美元的开发费用。更值得注意的是，DeepSeek主要使用英伟达H800芯片进行训练，这些芯片自2023年起被美国出口管制禁止向中国销售。

学术透明度开启AI发展新纪元

DeepSeek R1成为首个通过同行评议的主要大语言模型，这一先例在AI学术界引起广泛赞誉。机器学习工程师、论文评审员刘易斯·滕斯托尔称这是"非常值得欢迎的先例"，强调"如果我们没有公开分享这一过程大部分内容的标准，就很难评估这些系统是否存在风险"。

在同行评议过程中，DeepSeek团队根据评审意见减少了对模型的拟人化描述，并增加了技术细节说明，包括模型训练数据类型和安全性考虑。这种严格的学术审查流程不仅验证了模型的有效性，也为其他AI公司树立了榜样。

论文发表后，DeepSeek明确否认了此前关于其使用OpenAI模型输出进行训练的指控。该公司在与评审员的交流中声明，R1并非通过复制其他大语言模型生成的推理示例来学习。虽然承认其基础模型像其他大语言模型一样在网络上训练，可能包含已存在的AI生成内容，但DeepSeek坚持其核心训练方法的原创性。

滕斯托尔表示，尽管无法百分之百确定R1未使用OpenAI示例进行训练，但其他实验室的复制尝试表明"DeepSeek的推理方法可能足够优秀，无需这样做"。他补充道："现在的证据相当明确，仅使用纯强化学习就能获得极高性能。"

全球AI竞争格局的重新洗牌

DeepSeek的成功不仅仅是技术突破，更是对全球AI产业发展模式的深刻挑战。其开源策略使R1成为AI社区平台Hugging Face上最受欢迎的开放权重模型，下载量已达1090万次。这种开放模式与美国科技巨头的封闭生态系统形成鲜明对比，为全球AI研发提供了新的范式。

在科学任务完成挑战ScienceAgentBench中，R1虽然在准确性方面未居首位，但在平衡能力与成本方面表现出色，证明了其在实际应用中的竞争力。这一表现进一步证实了低成本高效能AI模型的可行性，对整个行业的资源配置策略产生深远影响。

目前，众多研究团队正尝试将DeepSeek的方法应用于改进现有大语言模型的推理能力，并将其扩展到数学和编程之外的其他领域。正如滕斯托尔所言，R1已经"启动了一场革命"。

DeepSeek的崛起标志着AI发展进入新阶段，其低成本高效能的技术路径、开源开放的发展理念，以及对学术透明度的坚持，正在重新定义人工智能产业的竞争规则。随着更多研究机构和企业开始关注并采用类似方法，全球AI技术发展有望迎来更加多元化和民主化的未来。这场由中国初创企业引发的技术革命，最终可能惠及全人类的科技进步。

展开阅读全文

更新时间：2025-10-18

标签：科技封面模型学术自然论文梁文峰语言方法全球中国透明度示例技术同行

1 2 3 4 5

梁文峰在《自然》发表封面论文 DeepSeek成首个严格学术审查大模型

突破性的强化学习方法改写AI训练范式

学术透明度开启AI发展新纪元

全球AI竞争格局的重新洗牌

全球公共安全合作论坛（连云港）2025年大会开幕

会地合作注入新动能，高淳“全国科普月”拉开帷幕

探寻万亿生物经济合成密码，2025山东生物制造媒体行活动启动

最具影响力！“机器人及人工智能”全国总决赛中，北林获一等奖！

广州迈步跨境电商有限公司成立注册资本5万人民币

刚刚，李飞飞空间智能新成果震撼问世！3D世界生成进入无限探索

招聘人工智能教研员要求高中竞赛成绩？宁波市教育局回应

英思特在内蒙古成立磁能科技公司

中国首个口岸传播研究机构成立

河南省航空航天科普展在郑开幕点燃青少年航天热情

2025新一代计算产业大会召开聚焦算力标准与技术创新

冲上热搜！赶紧查查你的支付宝

都是大飞机，为什么200吨的运20能国产，70吨的C919却要靠国外？

揭秘女骑手现状，高价单背后，是湿衣服和难以启齿的尴尬

网传匹克全员大幅降薪：仅口头通知，公司称全体同事均表示理解

全球公共安全合作论坛（连云港）2025年大会开幕

英思特在内蒙古成立磁能科技公司

中国首个口岸传播研究机构成立

2025新一代计算产业大会召开聚焦算力标准与技术创新

中美俄粮食储备量比拼：美国3亿吨，俄罗斯4500万吨，中国呢？

洪流之上：中国长牛慢牛不可阻挡

宁德打造人才“引力场” 全球科创大赛助推新质生产力

中美日上半年GDP差距断崖，美国15万亿，日本 2.11 万亿，中

全国科普月丨长兴县主场活动暨新川新能源科技馆启用仪

让孩子放下手机，别靠断网禁止，这些方法超有效！