‌谷歌I/O开发者大会:正式发布视频生成模型Veo3,AI音画同步突破

‌谷歌I/O开发者大会:正式发布视频生成模型Veo3,AI音画同步突破

在2025年谷歌I/O开发者大会上,新一代视频生成模型Veo3正式亮相,首次实现背景音效与画面的AI同步生成。该模型不仅能根据文本提示合成动态场景,还能为鸟鸣、交通等环境音效匹配画面,甚至生成人物对话时的精准口型动作。相较于前代产品,Veo3在物理模拟和口型同步技术上取得显著突破,其生成的1080P高清视频时长可达60秒以上,并能理解“航拍”“延时摄影”等专业影视术语。

目前,Veo3已面向美国地区的Gemini Ultra订阅用户及Vertex AI企业客户开放,并集成至谷歌影视制作平台Flow中。借助Flow工具,创作者可上传人物、场景图片作为参考,通过镜头控制功能实现画面旋转、缩放及横竖屏切换,甚至动态增减视频元素。与此同时,前代Veo2的基础功能仍向所有用户开放,保留了图像参考和镜头调整等创作自由。

针对日益严峻的AI内容识别难题,谷歌同步推出了SynthID Detector检测工具。用户上传文件即可识别是否包含加密水印,该技术已应用于部分生成模型,但尚未实现全平台覆盖。随着Veo3的推出,谷歌在AI视频生成领域的技术优势进一步扩大,其与Runway、OpenAI等企业的竞争也步入新阶段。

原创文章,作者:Google,如若转载,请注明出处:https://www.kejixun.com/article/719958.html

Google的头像Google认证作者

相关推荐

发表回复

登录后才能评论