剑指Sora,谷歌推出Veo文生视频模型:时长超1 分钟、最高 1080P

科技 2024-05-15 09:59 阅读:14

5 月 15 日消息,OpenAI 三个月前推出文本转视频 Sora,引发了网友、媒体以及圈内人士的广泛讨论。谷歌在今天召开的 2024 I / O 开发者大会上,也推出了对标产品-- Veo,可以生成长度超过1 分钟,分辨率最高 1080P 的“高质量”视频,并具有多种视觉和电影风格。

根据谷歌官方新闻稿,Veo 具备对自然语言有先进的理解能力,能够理解“延时摄影”、“航拍风景”等电影术语。

用户可以使用文本、图像或视频提示来指导他们所需的输出,谷歌表示,这样产生的视频“更加连贯一致”,在整个镜头中人物、动物和物体的动作也更加逼真。附上演示视频如下:

谷歌 DeepMind 首席执行官德米斯-哈萨比斯在周一的媒体预览会上表示,视频结果可以通过额外的提示进行完善,谷歌正在探索更多功能,使 Veo 能够制作故事板和更长的场景。