中国杭州AI初创公司DeepSeek开发的R1模型近日在《自然》杂志发表了同行评议版本,成为首个经过严格学术审查的主要大语言模型。DeepSeek 创始人兼 CEO 梁文峰为该论文的通讯作者。《自然》杂志不但将该篇论文作为封面论文,还在评论报道文章中用“里程碑式论文揭示 DeepSeek AI 模型的秘密”
这一里程碑式事件不仅揭示了该公司如何以仅29.4万美元的训练成本创造出震撼全球AI产业的模型,更重要的是,它为整个人工智能行业树立了透明度和科学严谨性的新标准。
今年1月,当DeepSeek R1模型发布时,其卓越的推理能力和极低的开发成本瞬间引发全球科技股大幅下跌,纳斯达克指数单日暴跌超过3%,英伟达等AI龙头企业市值蒸发数千亿美元。如今,随着经过同行评议的正式论文发布,这家中国公司的技术路径得到了学术界的认可,同时也为其创新方法提供了更可靠的科学依据。
论文链接:https://www.nature.com/articles/s41586-025-09422-z
DeepSeek R1的核心创新在于采用了"纯强化学习"这一自动化试错方法。与传统依赖人工标注推理示例的训练方式不同,R1通过奖励模型达到正确答案的行为来学习推理策略,而非模仿人类预设的推理模式。这种方法使模型能够自主发展出诸如自我反思、验证和动态调整等高级推理能力。
俄亥俄州立大学AI研究员孙欢表示,DeepSeek的这一创新"在研究界极具影响力",并指出"2025年迄今为止几乎所有在大语言模型中进行强化学习的工作,都可能在某种程度上受到R1的启发"。
为提升效率,DeepSeek还采用了一种名为"群体相对策略优化"的技术,让模型自我评估尝试结果,而非依赖独立算法进行评分。这些技术创新使得R1不仅在推理任务上表现卓越,在成本控制方面也实现了突破。
根据《自然》杂志论文的补充材料首次披露,R1的训练成本仅为29.4万美元,加上构建基础模型的约600万美元,总投入远低于竞争对手动辄数千万美元的开发费用。更值得注意的是,DeepSeek主要使用英伟达H800芯片进行训练,这些芯片自2023年起被美国出口管制禁止向中国销售。
DeepSeek R1成为首个通过同行评议的主要大语言模型,这一先例在AI学术界引起广泛赞誉。机器学习工程师、论文评审员刘易斯·滕斯托尔称这是"非常值得欢迎的先例",强调"如果我们没有公开分享这一过程大部分内容的标准,就很难评估这些系统是否存在风险"。
在同行评议过程中,DeepSeek团队根据评审意见减少了对模型的拟人化描述,并增加了技术细节说明,包括模型训练数据类型和安全性考虑。这种严格的学术审查流程不仅验证了模型的有效性,也为其他AI公司树立了榜样。
论文发表后,DeepSeek明确否认了此前关于其使用OpenAI模型输出进行训练的指控。该公司在与评审员的交流中声明,R1并非通过复制其他大语言模型生成的推理示例来学习。虽然承认其基础模型像其他大语言模型一样在网络上训练,可能包含已存在的AI生成内容,但DeepSeek坚持其核心训练方法的原创性。
滕斯托尔表示,尽管无法百分之百确定R1未使用OpenAI示例进行训练,但其他实验室的复制尝试表明"DeepSeek的推理方法可能足够优秀,无需这样做"。他补充道:"现在的证据相当明确,仅使用纯强化学习就能获得极高性能。"
DeepSeek的成功不仅仅是技术突破,更是对全球AI产业发展模式的深刻挑战。其开源策略使R1成为AI社区平台Hugging Face上最受欢迎的开放权重模型,下载量已达1090万次。这种开放模式与美国科技巨头的封闭生态系统形成鲜明对比,为全球AI研发提供了新的范式。
在科学任务完成挑战ScienceAgentBench中,R1虽然在准确性方面未居首位,但在平衡能力与成本方面表现出色,证明了其在实际应用中的竞争力。这一表现进一步证实了低成本高效能AI模型的可行性,对整个行业的资源配置策略产生深远影响。
目前,众多研究团队正尝试将DeepSeek的方法应用于改进现有大语言模型的推理能力,并将其扩展到数学和编程之外的其他领域。正如滕斯托尔所言,R1已经"启动了一场革命"。
DeepSeek的崛起标志着AI发展进入新阶段,其低成本高效能的技术路径、开源开放的发展理念,以及对学术透明度的坚持,正在重新定义人工智能产业的竞争规则。随着更多研究机构和企业开始关注并采用类似方法,全球AI技术发展有望迎来更加多元化和民主化的未来。这场由中国初创企业引发的技术革命,最终可能惠及全人类的科技进步。
更新时间:2025-09-18
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号