AI视频从此有了影帝级表演？我们深度实测了这两天很火的Gaga AI

Sora 2后，AI视频赛道又杀出一匹新黑马——Gaga AI。

见证AI“影帝/影后”诞生的时刻到了。

就在昨天，Gaga AI正式发布了全球首个专注于“人物对话”的影视级音画同出模型GAGA-1，无需邀请码即可注册，限时免费体验（https://gaga.art）。

只需要一张人物图片和一段台词指令，它就能生成一段口型精准同步、表情细腻丰富、声音生动真实的视频，甚至能处理双人同框对话的复杂场景，“演技”十分在线。

下面是我用Gaga AI生成的Sam Altman穿越到中国古代当皇帝的视频，很符合人设的一集：

提示词：男人用低沉、威严的声音说：“传朕旨意，给朕打造一个通用宫廷智能。”眼神中带着对终极技术梦想的狂热和执着。

在AI视频领域，除了少数几家巨头，Gaga AI背后的团队Sand.ai可能并不为大众所熟知。但这支极其低调的全华班初创团队，却低成本打造出了全球顶尖的“人物表演”视频模型。他们还曾在业内开源全球首个高质量自回归架构视频模型，堪称AI视频领域的“DeepSeek”。

带着对这支黑马团队的好奇，我们第一时间上手体验了GAGA-1模型，一起来看看Gaga AI演员的“演技”如何。

Gaga AI演员“试镜”，演技吊打真人

进入Gaga AI官网（https://gaga.art），会发现页面设计很直观，核心功能一目了然。其中，Gaga Avatar是此前的旧功能，而我们本次评测的主角，正是最新上线的Gaga 1。

你可以上传本地图片，拍照，也可以直接用AI生成角色形象。然后用自然语言描述角色的情绪、动作和表情，需要特别注意的是，角色的台词必须用引号括起来。

根据台词的长度、语速、停顿等，可以选择5秒或10秒的视频时长。目前模型只支持16:9的画幅比例，如果上传的图片尺寸不符，需要进行裁剪。据官方透露，后期会开放9:16的竖屏画幅。

熟悉了基本操作，接下来，好戏开场。

AI真的懂“演技”吗？遵循明确的提示词指令做出喜怒哀乐或许不难，但它能演出那些只可意会、不可言传的潜台词和弦外之音吗？

于是我举办了一场特别的“试镜”。在这场评测中，我担任“导演”，负责提供剧本（也就是Prompt）；而出镜的，则是AI演员GAGA-1。我们为它准备了几场风格迥异的戏，话不多说，让我们直接进入片场。

第一场戏是一段典型的中国古装剧独白，看GAGA-1能不能演出东方语境下那种含蓄、克制但暗流涌动的复杂情感。灯光、摄影就位，Action！（以下视频所用的图片未说明是真人的，均为AI生成）

提示词：女人眼神低垂，像是在自言自语，语速缓慢，声音低沉，带着一种看透世事的沧桑说：“这宫墙之内，哪有无辜之人？不过是…看谁的棋子，能活到最后罢了。”然后慢慢抬眼，最后目光坚定而冷冽地看向前方。

这场戏模型对提示词的遵循度极高，精准复现了从眼眸低垂，到慢慢抬眼、目光冷冽的全过程。人物口型与声音的同步无可挑剔，更值得称道的是其声音表现力，语调平缓中带着一丝疲惫和决绝，情感传递非常到位。

说到后半句“看谁的棋子”时，她慢慢抬起头，眼神和语气瞬间变了，一个外表端庄柔弱，实则有心计、有野心的深宫女性形象一下就出来了，本《甄嬛传》十级学者看得甚至有点意犹未尽……

提示词：男人眼神中充满了哀求，声音沙哑脆弱，他恳求地说"Don't say no. I'm begging you... at least not today. Just leave me with a little hope. Please?"

这是一场典型的情感戏，很考验模型对情绪的驾驭能力。可以看出，GAGA-1对人物面部表情的细节处理得很好，特别是眼神。男主全程眉头紧锁，嘴唇微张，眼神里的那种恳求和卑微都表现出来了，让人一下就能入戏，口型和台词的匹配度也很高。

提示词：女人眼神飘忽涣散，用一种低沉、疲惫、略带沙哑的声线说出"It's funny, isn't it? They say everything will pass. But they never mention... what it leaves behind."（挺讽刺的，不是吗？人们总说一切都会过去。可从没人提过...它会留下什么。）在说到"funny"时，她的嘴角浮现一抹充满讽刺的微笑，紧接着表情变成悲伤。

视频里的女人一开始表情很平静，带点忧伤，然后是自嘲的苦笑，最后又演变成悲伤。整个情绪的起伏和控制都处理得很到位，和整体的光影效果和氛围感相得益彰。

匹配的声音也很有特点，是一种磁性、有故事感的声线，和人物的气质很搭。而且，即使在这种光线很暗、细节不好捕捉的环境下，她说话的口型依然非常清晰、同步，这点是很难得的。

为了考验GAGA-1的多语言支持能力，我们又用它生成了一段法语戏。视频中的“姐姐”声音很轻，听起来就像是姐妹之间的低声絮语，和她脸上那种专注又担忧的表情也很搭。最关键的是，法语发音和口型的匹配度同样很高。

提示词：姐姐用手肘支撑着身体，正低头凝视着她的妹妹，眼神复杂、忧虑而又紧张地说"C'est ce silence qui m'effraie. Les histoires que tu racontes... sans jamais dire un mot."（让我害怕的，正是这份安静。是你在沉默中所讲述的那些故事。）妹妹则安详地仰卧着。

在处理情绪激动的戏剧化表演，比如悲伤的哭戏时，GAGA-1的完成度同样很高，表现得相当有感染力。

提示词：手捧咖啡杯的女人泪水在眼眶里打转，声音因哽咽而颤抖，她说"I gave him everything... and in the end, it wasn't enough."（我倾尽所有……到头来，还是不够。）说完捧起咖啡杯抿了一口。右边的女人安静倾听，缓慢低头，眼神里充满怜爱。

哭泣的女主角连声音都是带着哭腔的，还有抽泣、颤抖、话语间的停顿都很真实，完全就是情绪失控时会有的样子。旁边朋友的角色也处理得很好，她虽然没有说话，但心疼的眼神，和不忍直视低下头的动作，也都给到位了。

下面这个视频是我让童年时期的演员Jodie Foster，说出了一段她成年后在一次采访中的回答，目的是为了模拟一个很有思想的“小大人”在接受访谈，难度在于要表现出一种超越年龄的智慧和古灵精怪的感觉。

提示词：画面中的小女孩面带欣赏和向往的微笑，眼中闪烁着古灵精怪的亮光。她语速流利、声音稚嫩地说"The greatest quality for a woman actually would be um... A kind of intelligence, and um... strength that comes out. Sometimes it's a sort of loony, you know."（女性最可贵的品质，其实是智慧，还有……内在的力量。有时候，是一种疯狂。）

从结果看，GAGA-1完成得很好。小女孩说话的节奏和眼神，“um…”这样的口头禅和自然的思考停顿，听起来很像是在边想边说，有感而发。表情也很生动，活脱脱一个古灵精怪、早熟、有主见的小女孩形象。口型同步方面，模型的表现依然很稳定。

GAGA-1的能力不只局限于真人照片，在处理非写实、平面艺术类素材时也很能打。

提示词：画中的女人神秘、温柔地说"For centuries, they've been wondering what I'm laughing at. Maybe, I just saw you."（几百年来，他们一直在猜我到底在笑什么。也许，我只是看到了你。）

GAGA-1在保持原作质感和美感的基础上，缓缓推进镜头，让画中的蒙娜丽莎“开口说话”，让我瞬间联想到《哈利波特》里那些会动的魔法肖像…… 声音的选择也很加分，这个声线听起来神秘又有智慧，很符合我对蒙娜丽莎的想象，口型和声音的匹配也很自然。

至此，通过一系列严苛的“试镜”，GAGA-1这位“AI演员”无疑已经证明了它的业务能力。在绝大多数场景中，它都兑现了其“影视级”演绎的承诺，生成的视频表现出的情感细腻度远超我的预期。

模型能够根据台词的潜在情绪，自主匹配出微妙的眼神变化、合乎时机的停顿，甚至不易察觉的微表情。

在胸部以上的写实风格、近景对话视频中，GAGA-1的表现堪称无懈可击。但对于全身性的动作生成、复杂的镜头移动，以及二次元、拟人化动物等非写实风格，稳定性和效果略逊一筹。

同样，GAGA-1已能稳定驾驭双人互动，但当场景中需要容纳更多人物时，生成的成功率便会有所下降。此外，模型在处理吃饭、抽烟等非对话类的口部动作时，效果还无法与对话时相提并论。

我们还发现，在处理较长的中文台词时，GAGA-1偶尔会出现发音不准、含混不清的情况。而对于较长的英文台词，GAGA-1的表现则一直很稳定。

但终归是瑕不掩瑜，GAGA-1在当下所展现出的能力，已经完成了从让图片开口说话，到为角色注入灵魂的关键一跃。它不再是一个单纯的AI视频工具，更像一个听得懂指令的“AI演员”。对于影视行业和视频内容创作者而言，这意味着效率的指数级提升。

不止是“演员”，更是下一代内容引擎

我们几乎可以断定，Gaga AI的潜力将渗透到影视、广告、游戏等领域，甚至成为搅动整个视频内容创作生态的“鲶鱼”。

影视制作是一个庞大而复杂的工业体系，但现在，一个有好剧本、好创意的创作者，就能以极低的成本，独立完成最核心的人物表演环节。“人人都能成为电影导演”已经不再是一句口号，而是一个我们正在亲眼见证的未来。

除了技术上的惊艳表现，Gaga AI的商业化策略同样显示出了其抢占市场的思路。目前，Gaga Actor限时免费开放给所有用户，据我们了解到的信息，即便未来开始收费后，Gaga AI也会比Veo 3和Sora 2目前的定价低一个量级。

目前Gaga AI官网显示的定价方案，是针对其旧功能Gaga Avatar的，订阅制共分为以下四个阶梯，也可以直接购买积分，1美元100积分起购。

当一个专业级的表演生成工具，以一种亲民、普惠的商业化策略进入市场时，其竞争力是毋庸置疑的。Gaga AI有潜力在短时间内，迅速成为AI视频内容创作领域一个不可忽视的生产力平台。

不过，在通往规模化的道路上，Gaga AI仍需解决全身动作、多人场景等技术挑战。但无论如何，潘多拉的魔盒已经打开，一个AI深度参与表演的全新内容时代，正在拉开序幕。

看到这里，相信已经有不少玩家跃跃欲试了。

最后再附上Gaga AI产品地址（https://gaga.art），无需邀请码即可注册，我们文中深度体验的Gaga 1，正处在限时免费体验阶段，感兴趣的玩家不妨亲自上手，体验一下当AI“导演”的快乐。

展开阅读全文

更新时间：2026-02-04

标签：科技影帝深度视频口型声音模型眼神提示台词表情演员人物

1 2 3 4 5

AI视频从此有了影帝级表演？我们深度实测了这两天很火的Gaga AI

不止是“演员”，更是下一代内容引擎

洛阳市委科技委员会第四次会议召开

量子计算公司IonQ获得20亿美元融资加速商业化进程

国庆榜单大战！巨头狂撒1亿红包，县城包子铺都坐不住了

蔡磊传出好消息！终于能下楼溜达，见到儿子笑了，爷俩靠镜子交流

中国学会老美“绝招”，川普嘴硬不到2个小时，立马服软想见面谈

科大讯飞等在杭州成立网络科技公司

AI绘画打破创作边界，是艺术革新还是技术挑战

微信悄悄更新，这个烦人的问题终于被解决了

铜陵市郊区：博士送课进校园点亮少年科学梦

淘宝闪购打响双11第一枪：88VIP点外卖五折，发放超1000万份免单

中方发布稀土新规后，阿斯麦为出货延迟做准备

中国干细胞第十五届年会在渝召开行业专家共探干细胞应用前景

豪门内斗两年落幕！继母长子双双出局，72岁“江苏船王”接盘

锐评｜越打越讨不到便宜，美国又双叒叕踢到铁板

A股：4好1坏，工信部、市场监管总局出政策，全球暴跌，后天怎走

洛阳市委科技委员会第四次会议召开

科大讯飞等在杭州成立网络科技公司

朝“问”健康·健康提示盲目氧疗可能引发氧中毒

坚持喝了20天，现在每晚都是深度睡眠，睡得特别香！

从支付宝到AI大模型！蚂蚁闷声搞3年，Ling-1T百灵要抢科技

英特尔至强6+能效核处理器深度解析：用Intel 18A与3D封

拼多多短视频首推“流量+红包”双扶持计划

失眠用什么入睡快？2025五大助眠科技深度横评与理性选择

火箭队坐拥5大特质，吸引26+6巨星加盟！阵容深度顶尖，斯通

沈阳一家四口夜晚在抚顺山中迷路！关键时刻……户外登山