不让 Sora 专美于前,Google 发表新一代 Veo 2 生成式影片模型
Google 的生成式影片 AI Veo 月初才刚刚开放企业用户进行小範围的预览,现在就已经发表了更新的版本了。稍早 Google 发表了新一代的 Veo 2 模型,根据该公司表示,Veo 2 除了能「理解电影摄影的语言」外,对现实世界的物理和人类运动有也更好的理解。
正确地模拟现实世界的物理及运动中的人类,是所有生成模型都在努力的方向,而 Google 声称 Veo 2 在这两个难点上都做得比以往更好。然而,Google 并没有提供多少的範例来佐证,到底改进了多少,大概要等试用的用户来发堀了。至于「理解电影摄影的语言」的部份,这让你在提示模型时,可以加入特定的电影类型、特效或镜头,来达成指定的效果。
同样在月初时刚开放测试的 Imagen 3 影像生成模型,也同样获得部份的改进。除了能产生更明亮、构图更佳的影像外,它也能更準确地呈现多样的艺术风格,同时也能让生成的影像更贴近提示文字。
Veo 2 将逐步向美国的 Google Labs 用户推出。目前,Google 将测试限制在最多生成 8 秒长的 720p 影片,作为比较,Sora 可以生成最多 20 秒的 1080p 影片,但需要每月 200 美元的 ChatGPT Pro 订阅。
相关文章: