杨(立昆)世界模型与大语言模型:哪个才是真正的人工智能?

最近,人工智能界爆出图灵奖得主、Meta首席AI科学家杨立昆(Yang LeCun)即将离职创业的消息,引发了一场关于人工智能技术路径的根本性辩论和系统性思考。杨的出走,主要原因在于他坚信当前主导AI产业的大型语言模型(以下称为LLM)是一条"死路",而真正的人工智能需要一种完全不同的架构——世界模型(本文将其称为“杨世界模型”,即YWM)。那么两个模型,或者说两种思路,到底哪个才是真正的人工智能呢?以下是个人粗浅的理解。

所谓的大语言模型全称Large Language Models,简称LLMs,是一种采用大量数据进行训练的人工智能模型,,基于Transformer架构,旨在理解和生成自然语言文本。我个人理解,这个模型的核心是(灌入)数据、(学习)训练和(言行)反馈。而杨立昆提出"世界模型"或"联合嵌入预测架构",不妨暂将其称为杨世界模型(YWM)。其核心思想是,真正的智能不应该依赖于语言作为主要的学习媒介,而应该通过自监督学习,从视频、图像等感官数据中提取世界的内在结构,通过感知和预测物理世界的变化,来建立对环境的理解。

杨立昆在AI领域耕耘了40年,是卷积神经网络之父,他与约书亚·本吉奥、杰弗里·辛顿共同奠定了现代深度学习的基础,可以说是人工智能的鼻祖之一。但正是这位深度学习的奠基人,面对LLM模型的蓬勃发展,特别是其在某些行业和领域的初步应用,如今却变为质疑基于Transformer架构的大语言模型能否通向真正的智能的先驱,反映了其对当前人工智能现状的深刻思考。杨立昆义为,大型语言模型"对逻辑的理解非常有限",永远无法实现像人类一样的推理和计划能力。在他看来,当前的LLM本质上是统计模式识别器,它们通过海量文本数据学习词语之间的概率关联,但缺乏对物理世界的真实理解。通过堆砌更多参数、投喂更多数据来追求通用人工智能,本质上是"胡说八道"。

杨认为,当前AI领域弥漫着一种危险的、对LLM能力无限夸大的炒作氛围,并多次强调,现有的语言模型连猫、狗的智能水平都达不到,因为它们缺乏对物理世界的基本常识。人类婴儿在学会说话之前,就已经通过看、听、触、感、悟以及互动等建立了关于物体、因果关系和物理规律的基本认知。猫也是通过对三维空间和物体运动的直觉理解,获取其在复杂环境中导航、追逐猎物、避开危险的能力。杨认为,AI系统也应该遵循类似的路径,而这正是当前LLM所缺失的。他讽刺那些宣称AI将在几年内超越人类的言论为"胡说八道"。当然,杨也并非完全否定深度学习或神经网络,而是主张需要新的架构和训练范式。但基于语言的学习只是人类智能的一小部分表现形式,真正像人类一样思考的AI,不是仅仅依赖文本,还必须让它们从感官数据中学习。

杨的观点在学术界有一定共鸣。一些研究者认为,当前基于Transformer的LLM虽然在处理序列数据方面表现出色,但它本质上是一个模式匹配器,缺乏真正的推理和因果理解能力。而人类的认知是多模态的,视觉、听觉、触觉等感官信息共同构建了我们对环境的理解。单纯依赖语言学习,就像试图通过阅读游泳手册来学会游泳——理论知识与实践技能之间存在无法逾越的鸿沟。但反对者也有充分的理由。他们认为LLM的潜力尚未充分释放。当前的语言模型可以在推理、规划等任务上取得显著进步,并已经能够完成复杂的多步推理、代码调试、科学问题求解等任务,这些能力在几年前被认为是不可能的。支持LLM路线的研究者认为,规模法则仍然有效,更大的模型、更多的数据、更好的训练方法将继续推动性能提升。

显然,争论的延伸必将涉及"智能"、人工智能、人的(类)智能等的基本定义。如果将智能定义为完成特定任务的能力,那么LLM已经在许多领域展现出超越人类的表现。正如前述,这种能力是一种统计模式识别器或模式匹配器工具,其核心仍然是按人设定的场景和方向完成任务,干的是收集整理数据、发现关联关系、机械重复动作、枚举逼近目标的工作,甚至有些就是假智能,完全是人在后台指挥或控制机器去完成任务。此外,它们要完成特定的任务仍然取决于正确的数据、客观的知识、确定的规则与可实现的场景。

但如果追求的是类人的通用智能(即人工智能),人类赋予机器能够灵活适应新环境、进行抽象推理、具备常识的系统,那么当前的模型确实还有很长的路要走。但这种能力本质上或最终仍然是人赋予机器的,实际上是解决了通过学习而获取智能的问题,是后学的的和被动的。但其比单纯的LLM模型前进了一步。这可能是杨立昆追求的目标,而不是一种单纯功能性AI。这样的智能在人类的引导下,通过不断的学习、调整、优化,自主的去实现人类期望其完成目标,甚至会出现人类不希望产出的结果,但不会先天的去为自己或为人类去设计目标。

而要真正达到人的(类)智能状态(兼具先天的与后学的,自主的与被动的智能),恐怕不是现在所提出的所有模型能够解决的,那条路可能长,更不可预期。例如,人类,一般的猫狗,其先天就具有许多智能(聪明不聪明),它们可以自主地去理解世界和自己、主动的改造世界和自身,而不用通过后天的学习和训练,不依赖于语言而存在。真要达到这样的状态,几乎不可能,除非人创造和地球新孕育出一种新的生物。不排除地外星球可能有,但这恐怕不是地球上人类的目标。

另外,虽然可以将现在的机器人、机器狗视为人工智能的一种应用,但绝不能将无人化等同为人工智能。现在很多行业或领域有一种认识,似乎用上无人化的装备就是实现了人工智能,实际上二者差得很远。

展开阅读全文

更新时间:2025-11-18

标签:科技   模型   人工智能   语言   世界   人类   智能   数据   能力   架构   领域

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top