
本文仅在今日头条发布,谢绝转载
具身智能行业现在最大的问题,不是机器人不够强,也不是算法不够聪明,而是缺乏有效的数据。为了解决这个问题,行业里出现一种靠“免费保洁”来换取数据的模式。
但我觉得,这条路走不通,甚至是在制造一个虚假的繁荣,最终会拖累整个行业的发展。

最近,一些具身智能AI公司开始用各种“邪修”办法采集数据。比如国外一家叫Shift的公司,说可以免费帮你打扫公寓。作为交换,保洁员会戴着摄像头,把你家里打扫的全过程录下来。
国内也有一家叫“自变量”的公司,搞类似的活动,推出了低价的“人机协作”保洁,后面干脆招募志愿者,让机器人直接住进用户家里。最终的目的都是采集数据。
这些做法看似用免费或者低价服务换来了公司最需要的东西:数据。但这种模式真的能造出我们想要的智能机器人吗?
要明白为什么不行,我们得先知道,机器人需要的“学习资料”和我们熟悉的AI有什么根本不同。
我们现在手机上用的AI,比如语言模型或AI绘画,它们的数据来源几乎是无限的。语言模型可以学习互联网上所有的文字,绘画AI可以学习海量的图片。这些数据获取成本很低。
但机器人不行。机器人生活在物理世界里,它的学习资料不是文字和图片,而是真实的物理互动。

举个例子,一个机器人要学会拿起一个鸡蛋。它需要的数据,不是一张鸡蛋的图片,也不是一句“轻轻拿起鸡蛋”的指令。它需要的是一整套完整的、同步的记录:摄像头看到了什么,机械臂的每个关节转动了多少角度,手指夹爪用了多大的力气才没有把鸡蛋捏碎。
这一整套包含视觉、动作、力度的信息,才是机器人能看懂的“教材”。这种教材,互联网上没有,只能在现实世界里,通过一次次真实的动作,一条条地去采集。
这就是整个行业面临的巨大难题:数据稀缺。
谷歌的团队曾经为了收集13万条机器人动作数据,让13台机器人在厨房里不间断地工作了17个月。这个成本和效率,和语言模型比起来,简直是天壤之别。
因为数据太难获取,行业内主要探索出了四种方法,但每种方法都有明显的缺点。
第一种方法是人类远程控制。就像打游戏一样,一个熟练的工程师远程操控机器人完成各种任务,系统在后台把所有数据都记录下来。这种方法得到的数据质量最高,因为数据完全来自机器人自己,非常真实。但缺点是太慢、太贵了,一个工程师一天也采集不了多少条,根本无法满足大规模训练的需求。
第二种方法是电脑模拟。在虚拟世界里,可以创造出成千上万个机器人,让它们24小时不停地练习。这种方法速度快、成本低,可以产生海量数据。但缺点是,虚拟世界和现实世界总有差距。在模拟中学会的本领,一到现实中就可能失灵,比如机器人不知道地板滑、不知道毛巾是软的。
第三种方法是捕捉人类动作。通过特殊的设备,把人做家务的动作记录下来,再让机器人模仿。这种方法能让机器人学会动作的“形”,但学不会动作的“神”。比如,人可以感知到物体的重量和材质,从而用合适的力气去抓取,但这些“力道”是无法通过动作捕捉来记录的。机器人只模仿外形,很可能把东西捏坏或者拿不起来。

第四种方法就是录制第一视角视频。也就是“免费保洁”这种模式在做的。让人戴着摄像头,把他看到的、做的事情都拍下来。这种方法获取数据最容易,规模也最大。但它的问题是,数据是残缺的。视频只记录了“看到了什么”,却没有记录“身体是怎么做的”。这就像只给机器人看了无数遍别人开车的视频,却没有给它方向盘和油门,它永远也学不会开车。
现在我们能看得很清楚了,“免费保洁”模式收集的,正是第四种数据——第一视角视频。
这种数据并非一无是处,它可以帮助机器人建立对世界的初步认知,比如知道杯子通常放在桌上,垃圾要扔进垃圾桶。

但是,对于做家务这种需要精确操作的任务来说,这种数据远远不够。机器人最终需要学会的是控制自己的“身体”,输出精确的物理动作。从“看懂”到“会做”,中间缺少了最关键的环节。所以,靠这种方式收集再多的视频数据,也无法让机器人真正学会如何擦桌子、洗碗、叠衣服。
更重要的是,这种模式带来了两个非常现实的问题。
第一个问题是严重的隐私风险。当一家公司派人来你家,用摄像头无死角地拍摄时,你家里的布局、你拥有的物品、你的生活习惯,就都变成了这家公司的数据。他们承诺会做“脱敏”处理,但数据泄露的风险永远存在。之前就有扫地机器人的测试照片被泄露到网上的先例,其中不乏非常私密的家庭场景。当你接受一项免费服务时,你很可能就成了被交易的商品。

第二个问题是对劳动者的潜在剥削。无论是国外的快递员,还是国内时薪很低的“数据采集员”,他们都在从事一种新的、非常枯燥的重复性劳动。他们的工作就是日复一日地模仿机器人做动作,为AI提供数据。这本质上是把机器人研发的高昂成本,转嫁给了这些低收入的劳动者。
这是一种“赛博流水线”工作,它并不创造一个更好的未来。
我感觉,具身智能行业当前对数据的追求,已经走偏了。大家都在想方设法地扩大数据的“量”,却忽视了数据的“质”,更没有去思考一个更深层次的问题:我们需要一个什么样的数据系统。
仅仅生产数据是不够的,一个有效的数据系统,远比单纯的数据量更重要。

那么,一个好的数据系统应该具备什么特点?
首先,数据应该是通用的。现在各家公司都在用自家的机器人采集数据,这些数据往往只适用于自己的机器人。这是一种巨大的浪费。我们需要建立一种标准,让A公司机器人采集的数据,也能被B公司的机器人学习和使用。这样整个行业才能更快地进步,而不是各家都从零开始。
其次,系统必须能从错误中学习。这才是机器人能持续变聪明的关键。一个真正有效的系统应该是这样的:机器人被部署到真实环境中工作,当它遇到困难、犯了错误时,系统会记录下这个失败的场景。然后,由人类工程师远程介入,向机器人展示正确的做法。这个“纠错”的过程,就是一条价值极高的数据。系统把这条数据收集起来,用来更新机器人的模型。
这个“部署-失败-纠错-学习-再部署”的过程,形成了一个闭环。通过这个闭环,机器人就可以在真实世界中不断地“吃一堑,长一智”,变得越来越能干。
而“免费保洁”模式,恰恰缺少了这个最重要的闭环。它只是单向地录制视频,无法形成有效的反馈和迭代。
“免费保洁”是一个吸引眼球的营销活动,它让大众了解到了机器人行业对数据的渴求。但我们必须清楚,这种模式提供的只是廉价、残缺的数据,还伴随着隐私和劳工问题。它不是通往通用智能机器人的康庄大道,反而可能是一条弯路。
真正困难且正确的工作,是去搭建那个能让数据自我完善、持续进化的系统。这需要行业里的公司们坐下来,合作建立数据标准,共同打造一个能让机器人从真实世界的错误中不断学习的平台。这虽然比搞“免费保洁”要困难得多,也枯燥得多,但这才是唯一正确的方向。
更新时间:2026-06-01
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号