DeepSeek第一批核心研究员相继离职:走的不是钱,是方向

在阅读此文之前,辛苦您点击一下“关注”,既方便您进行讨论和分享,又能给您带来不一样的参与感,感谢您的支持!

编辑:

郭达雅去年10月就已经决定要离开DeepSeek了。外界知道这件事是4月,比他做决定晚了将近半年。2025年下半年至今,这家曾让硅谷为之侧目的AI公司,至少5名核心研发成员确认离职,第一代大语言模型核心作者王炳宣去了腾讯,V3核心贡献者罗福莉被雷军千万年薪挖至小米,OCR系列核心作者魏浩然春节前后离开,多模态成果核心贡献者阮翀加盟元戎启行出任首席科学家。

郭达雅则以传闻近亿元总包加入字节跳动Seed团队,担任Agent方向负责人之一。这五个人,覆盖了基座模型、推理、OCR、多模态四条核心技术主线。

先说说最受关注的郭达雅。他本科毕业于中山大学,博士与微软亚洲研究院联合培养,2023年博士毕业后加入DeepSeek。在两年多时间里,他深度参与了V3、R1、Coder、Math等系列模型,是DeepSeek-Coder系列的第一作者。

他最核心的贡献是和团队提出的GRPO算法,这个算法后来被应用到R1的强化学习训练中,让模型能在有限算力条件下自发涌现推理能力。Google Scholar显示,他的论文被引用超过3.8万次,对一个博士毕业不到三年的人来说,这个数字相当罕见。

郭达雅的离开被媒体报道为“亿元年薪”挖角,抖音集团副总裁李亮很快出面回应,称报道不实,字节招聘的所有Seed团队技术人员薪资体系都一样,近期也没有招聘近亿元年薪的员工。但争议归争议,李亮的话里其实留了一个口子,他说不排除有些Seed技术人员四年后收益会达到数亿元。

真正值得关注的不是钱的数字,而是郭达雅为什么要走。多方消息显示,他去年10月就已经决定离开,核心原因在于他极其看好Agent方向,但当时在DeepSeek内部,Agent的优先级并不高,重心更多放在了底层基座模型的突破上。

这不是孤例。阮翀从幻方时期就加入DeepSeek,是Janus-Pro等多模态成果的核心贡献者,他加入元戎启行后出任首席科学家,主攻方向同样是基座模型在智能驾驶领域的落地。罗福莉去了小米,主导大模型实验室;王炳宣去了腾讯,继续做大语言模型相关的工作。

每个人走的路径不一样,但背后折射出的问题是一样的,当一家公司的战略重心和顶级研究员的个人判断出现偏离时,高薪只是延缓剂,不是解药。

DeepSeek总共不到200人,核心研究团队约100多人。这支团队的构成极为年轻,本科和硕士占比超七成,30岁以下超七成,几乎不社招,以应届生和实习生留任为主。在这样一支规模不到大厂十分之一、人均工作时长不到大厂一半的精锐团队中,每一个核心研究员的权重都被放大到了极致。

王炳宣参与过历代模型训练,是DeepSeek从0到1的基座搭建者;郭达雅一个人横跨推理、代码两大方向;罗福莉被雷军亲自下场招募。对大厂而言,流失一个核心研究员是局部损失;对DeepSeek而言,流失一个核心研究员意味着整条技术线可能出现断层。

如果把这套逻辑放到更大的行业背景里看,会发现一个有意思的对比。几乎在同一时期,OpenAI也在经历大规模的人才流失。2024年到2025年,OpenAI的离职名单里包括首席技术官Mira Murati、首席研究官Bob McGrew,以及至少11名科学家和高管,其中多人被Meta挖走,投入Meta耗资十亿美元组建的超级智能实验室。

这种人才从明星初创公司向成熟大厂的流动,某种程度上已经成为AI行业的一条规律,先由技术先驱撕开市场,再由巨头接盘完成商业化。郭达雅加入字节,罗福莉加入小米,王炳宣加入腾讯,每一笔看似天价的转会费背后,都是大厂在用资本为技术方向投票。

回到DeepSeek自身。这次离职潮的另一个特殊之处在于,它发生在V4模型一再推迟的背景下。V4从原定2026年2月中旬一推再推,至今仍未正式发布。据知情人士透露,V4要同时适配华为昇腾950PR和英伟达Blackwell两条硬件路线,一条是国产芯片战略,一条是出口管制下的备选方案,两条路并行,成本翻倍。

内部在竞争加剧下看不到明确节点,也加剧了人才对技术前景的怀疑。也就是在郭达雅入职字节的同一周,外媒报道了DeepSeek首次寻求外部融资的消息,至少3亿美元,估值不低于100亿美元。

梁文锋根本不缺钱,幻方量化2025年收益率56.6%,营收超50亿人民币。他融资买的是三件事,给员工股权一个市场价格锚点,为V4的研发提供资金保障,以及通过引入战略资本获得更广泛的资源支持。

梁文锋的管理哲学在业内出了名,不加班、不打卡、不设KPI,下午六七点可以正常下班。DeepSeek的工作氛围在全球AI公司里都算得上独一份,当Google、OpenAI、xAI的核心开发人员每周工作70到80小时时,DeepSeek的多数员工在下午6点到7点左右就离开了公司。

梁文锋认为一个人一天能高质量输出的时间很难超过6到8小时,DeepSeek也没有明确的绩效考核和截止时间,研究员可以自由组队或独自钻研新想法。这种近乎理想主义的组织文化,在硅谷和国内大厂都找不到第二家。

但理想主义也有边界。DeepSeek此前的定位,与其说是一家商业公司,不如说更像是一个完全独立于资本市场而运作的开源研究机构。然而市场竞争的节奏不会等人。

当豆包月活达到3.31亿反超DeepSeek,当字节、腾讯纷纷开始把世界模型推到台前,当AI编程和Agent成为全行业的主战场,DeepSeek在产品入口、多模态能力和商业化体系上的短板逐一暴露出来。

一个有趣的反转是,就在DeepSeek因为Agent优先级不高而流失人才的同时,字节在挖DeepSeek的人,腾讯同期挖走了字节Seed团队将近70人。AI人才市场已经进入一个循环博弈的状态,没有谁是稳的。

DeepSeek遭遇的困境并非孤例,而是国产AI硬科技初创公司在巨头碾压下的一面镜子。它揭示了一个更深层的结构性问题,当核心人才可以被资本精准定价时,技术理想就成了最廉价的留人工具。大厂有充足的算力资源、数亿用户的即时验证场景、成熟的股票激励体系,这些系统性优势,单凭一家初创公司的文化魅力和技术信仰很难对冲。

郭达雅选择字节,不是因为DeepSeek对他不好,而是他想做的事,公司不做。这提醒着所有志在创新的技术团队,比钱更重要的是方向的一致,比规模更重要的是判断的同步。人才可以流动,但方向的错位,终究要靠顶层战略的校准来弥合。

信息来源:

展开阅读全文

更新时间:2026-04-21

标签:科技   研究员   核心   方向   模型   字节   腾讯   团队   公司   基座   技术

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top