在今年的对标第代I/O开发者大会上,谷歌发布第三代视频生成模型Veo 3。谷歌
据悉,发布Veo 3对标OpenAI的视频生成Sora,具备生成视频的模型同时同步嵌入音效的能力。
谷歌表示,对标第代Veo 3不仅可以基于文本和图像提示生成高质量的谷歌视频,还能为人物对白、发布鸟鸣或街头交通等场景配上相应的视频生成音效,实现更逼真的模型视听体验。
谷歌DeepMind产品副总裁Eli Collins表示:“从文字和图像提示,到真实世界物理效果与精准的谷歌唇形同步,Veo 3的发布表现都非常出色。”
目前,视频生成该模型主要面向美国地区的模型Gemini Ultra订阅用户,每月收费249.99美元。
此外,Veo 3也将纳入谷歌面向企业客户的Vertex AI平台。
除了Veo 3外,谷歌还发布了多个与生成式AI相关的新产品,包括升级版图像生成模型Imagen 4、电影制作辅助工具Flow。
此外,谷歌还宣布对原来的Veo 2进行更新,并新增支持通过文字提示对视频中物体进行增删的功能。
目前,生成式AI在图像和视频创作领域的应用日益普及。
不过值得注意的是,谷歌在AI图像生成领域的历史并非一帆风顺。
2024年,谷歌因Imagen 3模型生成带有历史错误的图像内容而遭遇广泛批评,随后被迫重新发布该工具。
谷歌联合创始人Sergey Brin后来坦承,问题源于“测试不充分”。
(责任编辑:综合)
全国知名网络博主和中央、省主流媒体推宣“康养胜地、人文兴义”,为黔西南点赞