在昨天的Google I/O 2025大会上,谷歌发布了多项重磅AI更新。他们推出了一款全新的图像模型Imagen 4,同时发布了升级版视频生成器Veo 3、增强版Gemini Pro模型,以及一系列令人印象深刻的技术升级。
但将这些生成式媒体工具(generative media tools)串联起来的关键,是一个名为Flow的功能。
Flow是VideoFX的升级版,后者是谷歌实验室去年推出的实验性产品。它能帮助你创作电影感的短片,无缝衔接多个场景,并保持足够的连贯性来讲好一个故事。
Flow 是专为配合 Google DeepMind 最先进的模型而设计的。这些模型包括视频生成模型 Veo、图像生成模型 Imagen,以及负责语言处理和任务编排的 Gemini。
以下是 Flow 的全部功能列表:
进入后,点击"新建项目"开始。界面看起来有点像聊天机器人,中央有一个大型文本输入框,还有几个切换开关用于选择视频生成方式。
你可以选择以下方式:
洞穴中央矗立着一尊佛像,周围是正在打坐的僧侣。
Flow 会接收你的文字描述,并利用 Gemini(谷歌多模态 AI)将其转化为视觉化的电影场景。当你点击生成按钮时,Flow 会将提示词传递给 Veo 3(视频生成模型),由它将这些文字转换成高质量的视频片段。
只需选中视频片段,然后点击"延长"(Extend)选项。在文字提示框中描述你希望延长后的片段效果即可。
"帧转视频"工具(Frames to Video)的功能非常简单:它接收一张输入图片,然后将其转换成视频。你可以自由指定起始帧和结束帧。
谷歌还在探索与YouTube Shorts(短视频)及其他内容管道的整合,让创作者能够轻松实现从创意到触达受众的无缝衔接。
自从 Kling 1.0 发布以来,人们就一直在期待一款真正的人工智能(AI)视频制作工具。长期以来,拼接 AI 生成片段的唯一方法就是先导出素材,再用 Premiere 或 Final Cut 这类剪辑软件处理。虽然可行,但这种工作流程实在太耗时了。所以谷歌最终推出 Flow 这样的工具,确实在情理之中。
Flow 目前仅支持谷歌的 AI 模型(如 Gemini、Veo 和 Imagen),这对部分用户可能是个缺点。但说实话,大多数人不会在意,因为这些最新模型确实很出色。尤其是具备原生音频和对话生成能力的 Veo 3,这甚至是当前多数 AI 视频工具尚未实现的功能。
我对价格和可用性方面不太满意。Veo 3 仅限每月 250 美元套餐才能使用,这让人失望。而且目前仅在美国可用,这让美国以外的用户产生了严重的错失恐惧症(FOMO)。
无论如何,我迫不及待想看看创作者们能用Flow做出什么作品。期待它全球发布和价格下降的那一天。
更新时间:2025-05-27
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号