宇树开源 UnifoLM0,空间感知与理解能力比肩GeminiER 1.5

1月29日,宇树宣布开源 UnifoLM-VLA-0。UnifoLM-VLA-O是UnifoLM系列下面向通用人形机器人操作的视觉-语言-动作(VLA)大模型。该模型旨在突破传统VLM在物理交互中的局限,通过在机器人操作数据上的继续预训练,实现了从通用”图文理解”向具备物理常识的”具身大脑”的进化。

模型在空间感知与理解能力上较 Qwen2.5-VL-7B有显著提升,并且在“nothinking”模式下可比肩Gemini-Robotics-ER 1.5。

展开阅读全文

更新时间:2026-02-02

标签:科技   能力   空间   模型   机器人   物理   操作   人形   大脑   视觉   常识   传统   动作

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top