AI视频从此有了影帝级表演?我们深度实测了这两天很火的Gaga AI

Sora 2后,AI视频赛道又杀出一匹新黑马——Gaga AI


见证AI“影帝/影后”诞生的时刻到了。


就在昨天,Gaga AI正式发布了全球首个专注于“人物对话”的影视级音画同出模型GAGA-1,无需邀请码即可注册,限时免费体验(https://gaga.art)。


只需要一张人物图片和一段台词指令,它就能生成一段口型精准同步、表情细腻丰富、声音生动真实的视频,甚至能处理双人同框对话的复杂场景,“演技”十分在线


下面是我用Gaga AI生成的Sam Altman穿越到中国古代当皇帝的视频,很符合人设的一集:


提示词:男人用低沉、威严的声音说:“传朕旨意,给朕打造一个通用宫廷智能。”眼神中带着对终极技术梦想的狂热和执着。



在AI视频领域,除了少数几家巨头,Gaga AI背后的团队Sand.ai可能并不为大众所熟知。但这支极其低调的全华班初创团队,却低成本打造出了全球顶尖的“人物表演”视频模型。他们还曾在业内开源全球首个高质量自回归架构视频模型,堪称AI视频领域的“DeepSeek”


带着对这支黑马团队的好奇,我们第一时间上手体验了GAGA-1模型,一起来看看Gaga AI演员的“演技”如何。



Gaga AI演员“试镜”,演技吊打真人


进入Gaga AI官网(https://gaga.art),会发现页面设计很直观,核心功能一目了然。其中,Gaga Avatar是此前的旧功能,而我们本次评测的主角,正是最新上线的Gaga 1



你可以上传本地图片,拍照,也可以直接用AI生成角色形象。然后用自然语言描述角色的情绪、动作和表情,需要特别注意的是,角色的台词必须用引号括起来


根据台词的长度、语速、停顿等,可以选择5秒或10秒的视频时长。目前模型只支持16:9的画幅比例,如果上传的图片尺寸不符,需要进行裁剪。据官方透露,后期会开放9:16的竖屏画幅。


熟悉了基本操作,接下来,好戏开场。


AI真的懂“演技”吗?遵循明确的提示词指令做出喜怒哀乐或许不难,但它能演出那些只可意会、不可言传的潜台词和弦外之音吗?


于是我举办了一场特别的“试镜”。在这场评测中,我担任“导演”,负责提供剧本(也就是Prompt);而出镜的,则是AI演员GAGA-1。我们为它准备了几场风格迥异的戏,话不多说,让我们直接进入片场。


第一场戏是一段典型的中国古装剧独白,看GAGA-1能不能演出东方语境下那种含蓄、克制但暗流涌动的复杂情感。灯光、摄影就位,Action!(以下视频所用的图片未说明是真人的,均为AI生成)


提示词:女人眼神低垂,像是在自言自语,语速缓慢,声音低沉,带着一种看透世事的沧桑说:“这宫墙之内,哪有无辜之人?不过是…看谁的棋子,能活到最后罢了。”然后慢慢抬眼,最后目光坚定而冷冽地看向前方。


这场戏模型对提示词的遵循度极高,精准复现了从眼眸低垂,到慢慢抬眼、目光冷冽的全过程。人物口型与声音的同步无可挑剔,更值得称道的是其声音表现力,语调平缓中带着一丝疲惫和决绝,情感传递非常到位。


说到后半句“看谁的棋子”时,她慢慢抬起头,眼神和语气瞬间变了,一个外表端庄柔弱,实则有心计、有野心的深宫女性形象一下就出来了,本《甄嬛传》十级学者看得甚至有点意犹未尽……


提示词:男人眼神中充满了哀求,声音沙哑脆弱,他恳求地说"Don't say no. I'm begging you... at least not today. Just leave me with a little hope. Please?"



这是一场典型的情感戏,很考验模型对情绪的驾驭能力。可以看出,GAGA-1对人物面部表情的细节处理得很好,特别是眼神。男主全程眉头紧锁,嘴唇微张,眼神里的那种恳求和卑微都表现出来了,让人一下就能入戏,口型和台词的匹配度也很高。


提示词:女人眼神飘忽涣散,用一种低沉、疲惫、略带沙哑的声线说出"It's funny, isn't it? They say everything will pass. But they never mention... what it leaves behind."(挺讽刺的,不是吗?人们总说一切都会过去。可从没人提过...它会留下什么。)在说到"funny"时,她的嘴角浮现一抹充满讽刺的微笑,紧接着表情变成悲伤。



视频里的女人一开始表情很平静,带点忧伤,然后是自嘲的苦笑,最后又演变成悲伤。整个情绪的起伏和控制都处理得很到位,和整体的光影效果和氛围感相得益彰。


匹配的声音也很有特点,是一种磁性、有故事感的声线,和人物的气质很搭。而且,即使在这种光线很暗、细节不好捕捉的环境下,她说话的口型依然非常清晰、同步,这点是很难得的


为了考验GAGA-1的多语言支持能力,我们又用它生成了一段法语戏。视频中的“姐姐”声音很轻,听起来就像是姐妹之间的低声絮语,和她脸上那种专注又担忧的表情也很搭。最关键的是,法语发音和口型的匹配度同样很高。


提示词:姐姐用手肘支撑着身体,正低头凝视着她的妹妹,眼神复杂、忧虑而又紧张地说"C'est ce silence qui m'effraie. Les histoires que tu racontes... sans jamais dire un mot."(让我害怕的,正是这份安静。是你在沉默中所讲述的那些故事。)妹妹则安详地仰卧着。



在处理情绪激动的戏剧化表演,比如悲伤的哭戏时,GAGA-1的完成度同样很高,表现得相当有感染力


提示词:手捧咖啡杯的女人泪水在眼眶里打转,声音因哽咽而颤抖,她说"I gave him everything... and in the end, it wasn't enough."(我倾尽所有……到头来,还是不够。)说完捧起咖啡杯抿了一口。右边的女人安静倾听,缓慢低头,眼神里充满怜爱。

哭泣的女主角连声音都是带着哭腔的,还有抽泣、颤抖、话语间的停顿都很真实,完全就是情绪失控时会有的样子。旁边朋友的角色也处理得很好,她虽然没有说话,但心疼的眼神,和不忍直视低下头的动作,也都给到位了。


下面这个视频是我让童年时期的演员Jodie Foster,说出了一段她成年后在一次采访中的回答,目的是为了模拟一个很有思想的“小大人”在接受访谈,难度在于要表现出一种超越年龄的智慧和古灵精怪的感觉。


提示词:画面中的小女孩面带欣赏和向往的微笑,眼中闪烁着古灵精怪的亮光。她语速流利、声音稚嫩地说"The greatest quality for a woman actually would be um... A kind of intelligence, and um... strength that comes out. Sometimes it's a sort of loony, you know."(女性最可贵的品质,其实是智慧,还有……内在的力量。有时候,是一种疯狂。)

从结果看,GAGA-1完成得很好。小女孩说话的节奏和眼神,“um…”这样的口头禅和自然的思考停顿,听起来很像是在边想边说,有感而发。表情也很生动,活脱脱一个古灵精怪、早熟、有主见的小女孩形象。口型同步方面,模型的表现依然很稳定。


GAGA-1的能力不只局限于真人照片,在处理非写实、平面艺术类素材时也很能打。


提示词:画中的女人神秘、温柔地说"For centuries, they've been wondering what I'm laughing at. Maybe, I just saw you."(几百年来,他们一直在猜我到底在笑什么。也许,我只是看到了你。)


GAGA-1在保持原作质感和美感的基础上,缓缓推进镜头,让画中的蒙娜丽莎“开口说话”,让我瞬间联想到《哈利波特》里那些会动的魔法肖像…… 声音的选择也很加分,这个声线听起来神秘又有智慧,很符合我对蒙娜丽莎的想象,口型和声音的匹配也很自然。


至此,通过一系列严苛的“试镜”,GAGA-1这位“AI演员”无疑已经证明了它的业务能力。在绝大多数场景中,它都兑现了其“影视级”演绎的承诺,生成的视频表现出的情感细腻度远超我的预期


模型能够根据台词的潜在情绪,自主匹配出微妙的眼神变化、合乎时机的停顿,甚至不易察觉的微表情。


在胸部以上的写实风格、近景对话视频中,GAGA-1的表现堪称无懈可击。但对于全身性的动作生成、复杂的镜头移动,以及二次元、拟人化动物等非写实风格,稳定性和效果略逊一筹。


同样,GAGA-1已能稳定驾驭双人互动,但当场景中需要容纳更多人物时,生成的成功率便会有所下降。此外,模型在处理吃饭、抽烟等非对话类的口部动作时,效果还无法与对话时相提并论。


我们还发现,在处理较长的中文台词时,GAGA-1偶尔会出现发音不准、含混不清的情况。而对于较长的英文台词,GAGA-1的表现则一直很稳定。


但终归是瑕不掩瑜,GAGA-1在当下所展现出的能力,已经完成了从让图片开口说话,到为角色注入灵魂的关键一跃。它不再是一个单纯的AI视频工具,更像一个听得懂指令的“AI演员”。对于影视行业和视频内容创作者而言,这意味着效率的指数级提升。



不止是“演员”,更是下一代内容引擎


我们几乎可以断定,Gaga AI的潜力将渗透到影视、广告、游戏等领域,甚至成为搅动整个视频内容创作生态的“鲶鱼”。


影视制作是一个庞大而复杂的工业体系,但现在,一个有好剧本、好创意的创作者,就能以极低的成本,独立完成最核心的人物表演环节。“人人都能成为电影导演”已经不再是一句口号,而是一个我们正在亲眼见证的未来。


除了技术上的惊艳表现,Gaga AI的商业化策略同样显示出了其抢占市场的思路。目前,Gaga Actor限时免费开放给所有用户,据我们了解到的信息,即便未来开始收费后,Gaga AI也会比Veo 3和Sora 2目前的定价低一个量级


目前Gaga AI官网显示的定价方案,是针对其旧功能Gaga Avatar的,订阅制共分为以下四个阶梯,也可以直接购买积分,1美元100积分起购。



当一个专业级的表演生成工具,以一种亲民、普惠的商业化策略进入市场时,其竞争力是毋庸置疑的。Gaga AI有潜力在短时间内,迅速成为AI视频内容创作领域一个不可忽视的生产力平台


不过,在通往规模化的道路上,Gaga AI仍需解决全身动作、多人场景等技术挑战。但无论如何,潘多拉的魔盒已经打开,一个AI深度参与表演的全新内容时代,正在拉开序幕。


看到这里,相信已经有不少玩家跃跃欲试了。


最后再附上Gaga AI产品地址(https://gaga.art),无需邀请码即可注册,我们文中深度体验的Gaga 1,正处在限时免费体验阶段,感兴趣的玩家不妨亲自上手,体验一下当AI“导演”的快乐。

展开阅读全文

更新时间:2025-10-13

标签:科技   影帝   深度   视频   口型   声音   模型   眼神   提示   台词   表情   演员   人物

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top