从自传理念到产品:李飞飞用Marble解锁AI空间智能

2025年9月16日,李飞飞团队搞出了个大动静。

她创办的WorldLabs才成立3个月,估值就飙到10亿美元,这次直接放出了Marble模型的新版本,靠一张图或者一段文字,就能生成能随便逛的3D世界,还没啥时间限制,也不会变形走样。

这事儿放在以前真不敢想,之前AI做3D,顶多弄个孤立的小物件,比如一把椅子、一个杯子,想搞个能连贯探索的场景难如登天。

现在Marble一出来,相当于把AI从“做零件”升级到“盖房子”,甚至能拼出一整个小镇。

虚幻引擎有个搞VR电影的大哥,看完直接说想用来做互动电影,让观众自己在场景里找剧情,这玩法以前只能靠大团队砸钱才敢想。

Marble模型有多能打?看看这些实在变化

Marble这次升级,不是玩虚的,之前的版本生成的场景小,风格也单一,现在不光能做更大的场景,画风还能随便换,一会儿是卡通小人国,一会儿又能变成跟照片似的写实风格。

最让人惊喜的是几何细节,地毯上的花纹、墙上的纹理,凑近了看都清清楚楚,不像以前,放大了全是模糊的像素块。

普通用户也能玩得转,有网友用两张旅行照片加一张现成图片,拼出了个3D世界,既能放大看石头缝里的小草,也能缩小看整片山林的样子,还发现了照片里没注意到的小角落。

不过有个小遗憾,目前这模型只能做环境,像人、动物这类活物还搞不定,估计得等后续升级了。

配套的Spark渲染库也很贴心,生成的3D世界能转成高斯分布图,直接倒进Three.js这个工具里,电脑、手机、VR眼镜都能流畅运行。

不用像以前那样,换个设备就得重新调参数,省了不少麻烦。

能搞出这技术,团队果然不一般

李飞飞本身就是计算机视觉领域的大牛,以前搞的ImageNet项目,直接推动了深度学习在图像识别上的发展。

2024年她还出了本自传《我看见的世界》,书里就说“空间智能才是AI的下一站”,现在看来,她是真把想法落地了。

她找的三个合伙人也都是狠角色,贾斯汀·约翰逊是她学生,搞出的实时风格转换技术,现在Meta、Snap的滤镜都在用,克里斯托夫·拉斯纳之前在EpicGames上班,把NeRF技术搞进了VR设备,本·米尔登霍尔更厉害,是NeRF技术的联合提出者,这技术可是现在3D重建的核心。

团队里还有不少华人面孔,官网显示有十多位华人技术人员,谢赛宁、吴佳俊这些华人学者还来当顾问。

在AI顶尖领域能看到这么多华人身影,还挺提气的,这么强的团队,自然不缺投资。

A16Z、恩颐投资这些大机构都投了钱,杰夫·辛顿、安德烈·卡帕西这些AI圈的大佬也亲自下场。

不过话说回来,估值10亿美元,压力肯定不小,以后得靠产品说话才行。

这技术能改变啥?不止是好玩

对专业人士来说,Marble算是解放了生产力,以前做个3D游戏场景,得建模师熬几个月,现在靠文字描述就能快速出初稿,修改也方便。

VR内容制作成本也降了不少,不用再为不同设备单独适配模型,省下来的钱能花在创意上。

普通用户也能过把“造物主”的瘾,不用学复杂的建模软件,靠自己拍的照片就能做3D纪念场景,比如把婚礼现场、旅行打卡地做成3D的,以后回忆起来能直接“走进去”,这比看照片有意思多了。

李飞飞团队说,下一步要开放Marble的Beta版,还会放API接口,让大家能把3D世界直接嵌到自己的项目里。

以后说不定能看到更多用它做的游戏、电影,甚至线上展览,不过也别太急,现在只是开始,要实现“能互动的完整虚拟世界”,比如在里面搬东西、玩水,还得等团队继续攻关。

Marble这次突破,算是给AI3D生成开了个好头,从只能做小物件到能搭大场景,这一步迈得不小,以后要是能把活物、物理互动这些功能加上,说不定真能像李飞飞说的那样,让AI“走进”完整的3D世界。

至于最终能做到啥程度,咱们就等着看后续发展吧。

展开阅读全文

更新时间:2025-09-20

标签:科技   自传   解锁   理念   智能   产品   空间   李飞飞   场景   团队   世界   技术   照片   模型   华人   活物   风格   物件

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top