12.17.24 | 22:30 PM
Google版Sora深夜秀肌肉 支持4K视频生成
BY 媒介360

Google Deepmind 推出了新的视频模型 Veo 2 和 Imagen 3。

根据官方介绍,Veo 2 带来了多项重要突破:支持制作高达 4K 分辨率的视频;能够识别指令中的摄像机控制,例如广角、第一人称视角和无人机拍摄;能更真实地模拟物理现象和人类表情变化。

相比其他视频模型常见的「错误生成」问题(如多余手指或意外物体),Veo 2 显著降低了这类错误的出现频率,大幅提升了输出结果的真实度。

在安全性方面,所有由 Veo 2 生成的视频都会嵌入不可见的 SynthID 水印,便于识别其 AI 生成的属性。

Google Labs 的视频生成工具 VideoFX 已集成了 Veo 2 的新功能,同时扩大了用户访问范围。

不过,DeepMind 有意控制推广的速度,计划在明年将 Veo 2 的功能逐步引入 YouTube Shorts 等产品,以在扩展应用范围的同时确保模型质量和安全性。

与此同时,Imagen 3 也实现了重大突破。新版本不仅支持创作多种艺术风格(包括现实主义、幻想、肖像等),能够更精确地将文字描述转化为图像,以及生成更明亮、构图更协调的视觉作品。

此外,Google 还推出了名为 Whisk 的工具。该工具在技术层面整合了最新的 Imagen 3 模型与 Gemini 的视觉理解能力。Gemini 模型可以自动为图像生成详细描述,这些描述随后会作为输入传递给 Imagen 3。用户可以通过导入或创作图像,表达特定主题、场景和风格需求,并将这些元素融合重组,创作数字化产品。

advertisement