2025年9月16日,李飞飞团队搞出了个大动静。
她创办的WorldLabs才成立3个月,估值就飙到10亿美元,这次直接放出了Marble模型的新版本,靠一张图或者一段文字,就能生成能随便逛的3D世界,还没啥时间限制,也不会变形走样。
这事儿放在以前真不敢想,之前AI做3D,顶多弄个孤立的小物件,比如一把椅子、一个杯子,想搞个能连贯探索的场景难如登天。
现在Marble一出来,相当于把AI从“做零件”升级到“盖房子”,甚至能拼出一整个小镇。
虚幻引擎有个搞VR电影的大哥,看完直接说想用来做互动电影,让观众自己在场景里找剧情,这玩法以前只能靠大团队砸钱才敢想。
Marble这次升级,不是玩虚的,之前的版本生成的场景小,风格也单一,现在不光能做更大的场景,画风还能随便换,一会儿是卡通小人国,一会儿又能变成跟照片似的写实风格。
最让人惊喜的是几何细节,地毯上的花纹、墙上的纹理,凑近了看都清清楚楚,不像以前,放大了全是模糊的像素块。
普通用户也能玩得转,有网友用两张旅行照片加一张现成图片,拼出了个3D世界,既能放大看石头缝里的小草,也能缩小看整片山林的样子,还发现了照片里没注意到的小角落。
不过有个小遗憾,目前这模型只能做环境,像人、动物这类活物还搞不定,估计得等后续升级了。
配套的Spark渲染库也很贴心,生成的3D世界能转成高斯分布图,直接倒进Three.js这个工具里,电脑、手机、VR眼镜都能流畅运行。
不用像以前那样,换个设备就得重新调参数,省了不少麻烦。
李飞飞本身就是计算机视觉领域的大牛,以前搞的ImageNet项目,直接推动了深度学习在图像识别上的发展。
2024年她还出了本自传《我看见的世界》,书里就说“空间智能才是AI的下一站”,现在看来,她是真把想法落地了。
她找的三个合伙人也都是狠角色,贾斯汀·约翰逊是她学生,搞出的实时风格转换技术,现在Meta、Snap的滤镜都在用,克里斯托夫·拉斯纳之前在EpicGames上班,把NeRF技术搞进了VR设备,本·米尔登霍尔更厉害,是NeRF技术的联合提出者,这技术可是现在3D重建的核心。
团队里还有不少华人面孔,官网显示有十多位华人技术人员,谢赛宁、吴佳俊这些华人学者还来当顾问。
在AI顶尖领域能看到这么多华人身影,还挺提气的,这么强的团队,自然不缺投资。
A16Z、恩颐投资这些大机构都投了钱,杰夫·辛顿、安德烈·卡帕西这些AI圈的大佬也亲自下场。
不过话说回来,估值10亿美元,压力肯定不小,以后得靠产品说话才行。
对专业人士来说,Marble算是解放了生产力,以前做个3D游戏场景,得建模师熬几个月,现在靠文字描述就能快速出初稿,修改也方便。
VR内容制作成本也降了不少,不用再为不同设备单独适配模型,省下来的钱能花在创意上。
普通用户也能过把“造物主”的瘾,不用学复杂的建模软件,靠自己拍的照片就能做3D纪念场景,比如把婚礼现场、旅行打卡地做成3D的,以后回忆起来能直接“走进去”,这比看照片有意思多了。
李飞飞团队说,下一步要开放Marble的Beta版,还会放API接口,让大家能把3D世界直接嵌到自己的项目里。
以后说不定能看到更多用它做的游戏、电影,甚至线上展览,不过也别太急,现在只是开始,要实现“能互动的完整虚拟世界”,比如在里面搬东西、玩水,还得等团队继续攻关。
Marble这次突破,算是给AI3D生成开了个好头,从只能做小物件到能搭大场景,这一步迈得不小,以后要是能把活物、物理互动这些功能加上,说不定真能像李飞飞说的那样,让AI“走进”完整的3D世界。
至于最终能做到啥程度,咱们就等着看后续发展吧。
更新时间:2025-09-20
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号