10亿美元种子轮 AlphaGo核心负责人创业 押注后大模型时代

AlphaGo核心负责人戴维·席尔瓦从DeepMind离职,在伦敦创立Ineffable Intelligence,推进规模达10亿美元的种子轮融资,主打绕开LLM的强化学习路线。这是AI行业对当前技术瓶颈的一次重磅破局尝试?

从AlphaGo到Ineffable:强化学习的回归逻辑

作为AlphaGo的核心设计者,戴维·席尔瓦在AI领域的声望早已被AlphaGo击败李世石的经典战役奠定。那场比赛中震惊世界的“第37手”,正是强化学习超越人类认知边界的直观体现。

与当前主流LLM依赖海量人类文本预训练的路径不同,席尔瓦始终坚信强化学习的核心价值:让AI通过自主探索获取新知,而非复刻人类已有知识。AlphaZero和MuZero的成功,更是为这一路线提供了硬核支撑。

AlphaZero仅用三天自我对弈就击败AlphaGo,MuZero无需规则就能在多类游戏中达到超人水平。这背后的逻辑是,AI不再是人类知识的“复读机”,而是能独立发现规律的“探索者”。这正是席尔瓦新公司名称“Ineffable”的由来——那些人类无法言说的智慧,恰恰是AI的下一片蓝海。

当前LLM的发展陷入了一个隐形瓶颈:模型能力上限被人类现有数据锁定。无论是预训练的文本库,还是RLHF阶段的人类反馈,都让AI始终无法跳出人类的认知圈。而强化学习的自主探索,本质是让AI突破这层天花板,成为真正的“原创智慧体”。

10亿美元押注:资本眼中的AI新赛道

在创投环境趋于理性的当下,一家尚未发布产品的初创公司能拿到10亿美元种子轮融资,堪称行业奇迹。资本的押注,本质是对两个核心逻辑的认可:席尔瓦的技术公信力,以及后大模型时代的赛道潜力。

过去几年,AI创投几乎被LLM赛道垄断,OpenAI、谷歌Gemini等项目吸走了大部分资源。但随着LLM的局限性逐渐显现,资本开始寻找差异化路线。席尔瓦的强化学习方案,恰好击中了行业对“AI下一站”的焦虑与期待。

从更宏观的视角看,这10亿美元是行业的一次战略性布局。与其在LLM的红海中继续内卷,不如押注可能带来范式革新的技术路线。毕竟,AlphaGo当年的横空出世,也曾颠覆整个AI行业的认知。

后大模型时代:AI的下一站是自主探索?

LLM的优势在于处理人类已知的、基于文本的任务,比如对话、内容生成、信息总结等。但在需要原创性突破的领域,比如科学研究、新药研发、新材料发现,LLM的能力就显得捉襟见肘——它无法生成人类知识体系中不存在的内容。

强化学习的自主探索路线,恰恰能填补这一空白。比如DeepMind的AlphaFold通过AI预测蛋白质结构,AlphaDev发现了更快的排序算法,这些都是AI自主探索带来的突破。未来,这类AI可能在更多前沿领域发挥作用,比如破解核聚变的控制难题,或是发现新的物理定律。

当然,强化学习路线也面临诸多挑战:训练成本高、落地场景有限、技术复杂度大等。但不可否认的是,它为AI的发展提供了另一种可能。未来的AI生态,大概率不会是单一路线的胜利,而是LLM与强化学习等多路线的共存互补。

对于普通用户而言,这意味着未来的AI不仅能帮我们处理日常事务,还能成为人类探索未知世界的“伙伴”。从复刻人类智慧到拓展人类认知,AI的价值正在发生本质性的转变。

席尔瓦的创业,不是对LLM的否定,而是对AI未来的一次大胆探索。10亿美元的押注,既是资本的信心,也是行业对突破技术瓶颈的渴望。或许在不久的将来,我们就能看到AI自主探索带来的下一个颠覆性成果。


#人工智能##OpenAI##谷歌##Gemini##与ChatGPT的有趣对话#

展开阅读全文

更新时间:2026-02-25

标签:科技   种子   模型   负责人   核心   美元   时代   押注   人类   路线   自主   行业   认知   赛道   技术   资本

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top