Google 视频 AI 路线图:Veo 3.1、Gemini Omni 与 Veo 4 悬念

2026/05/16

Google 的视频 AI 路线现在不能只用一个模型名字来概括。公开文档里,最明确的仍然是 Veo 3.1;创作产品层面,Flow 和 Gemini 正在承载越来越多视频工作流;而 Gemini Omni 这个新名字,则来自 I/O 前后的界面曝光和媒体报道。很多人关心 Veo 4 是否会出现,但这个问题本身已经不够完整。

截至 2026 年 5 月 17 日,更稳妥的理解方式是把这些名字拆开看:Veo 是已经有官方文档支撑的视频模型线;Gemini 是 Google 更大的 AI 产品生态;Flow 是面向电影感创作的工具;Gemini Omni 目前还属于未官宣信号,不能当成已经发布的产品。

已确认的一层:Veo 3.1

今天最有官方依据的名称是 Veo 3.1。Google 面向开发者的 Vertex AI 文档已经把 Veo 3.1 放在当前视频生成模型线里,能力包括文生视频、图生视频、提示词改写,以及用首帧和尾帧生成视频。

Google 自己的产品更新也在强化同一条线。近期关于 Veo 3.1 的说明,重点提到更好的叙事控制、参考图工作流、Ingredients-to-Video,以及 Flow 里的编辑能力增强。这说明 Google 不是停止推进 Veo,而是在把 Veo 从单次生成模型,继续往可控创作流程里推进。

对开发者和产品团队来说,这一点很重要。Veo 3.1 是现在可以规划、可以测试、可以查文档的部分。传闻会影响搜索热度,但真正做产品路线,还是应该以已经发布的能力为基础。

产品层:Gemini、Flow 和 Google Vids

Google 的视频故事已经不只是“某个模型生成一段视频”。模型当然重要,但用户真正接触到的是产品体验。

Flow 更像 AI 电影创作空间,需要镜头规划、角色一致性、参考图、音频和场景控制。Gemini 把视频生成放进更自然的对话入口。Google Vids 则把 AI 视频能力带到办公沟通场景里。

所以 Google 下一次视频能力升级,未必会表现成一个单纯的“Veo 4 发布”。它可能是 Gemini 的新功能,可能是 Flow 的编辑升级,也可能是 Vertex AI 的模型更新,甚至可能同时出现在多个入口。

这也是为什么只盯着 Veo 4 这个名字不够。创作者真正关心的是:能不能稳定生成、能不能继续修改、能不能保留已经满意的部分,而不是每次调整都重新抽一次结果。

未确认的一层:Gemini Omni

Gemini Omni 现在更适合被看作一个未确认的产品或模型信号。外部报道和界面曝光显示,它可能是 Gemini 内的视频创作体验,方向包括生成、混剪、模板和对话式编辑。这和 Google 当前的多模态战略是匹配的,但它还不是 Google 官方文档里的正式模型名称。

Gemini Omni 真正值得关注的地方,不是“又多了一个文生视频模型”,而是它可能把重点放在编辑上。如果未来它能让用户先生成一段视频,再用自然语言指定修改,同时保留原本满意的主体、构图和运动,那它解决的是一个更实际的创作问题。

这和第一代视频生成工具不一样。第一代工具更像从提示词里抽取一个结果;更成熟的视频工作流,则需要参考图、聊天修改、时间线、局部调整和模型输出一起协作。

Veo 4 到底该怎么看?

大家搜索 Veo 4 很正常。Google 先有 Veo,再有 Veo 2 和 Veo 3,按命名惯性,下一代看起来就应该叫 Veo 4。但命名惯性不等于官方路线图。

现在可能出现几种情况:

  • Google 以后确实发布一个叫 Veo 4 的模型;
  • Google 继续增强 Veo 3.1,但把新功能更多放在 Gemini 和 Flow 里;
  • Gemini Omni 成为 Veo 技术在前台的创作入口名称;
  • Omni 成为一个更 Gemini 原生的视频系统,而 Veo 继续面向开发者和企业客户。

因此,实际做产品或内容规划时,不要把 Veo 4 当作已经存在的确定对象。它可以作为搜索需求观察,但事实层面仍然要回到 Veo 3.1 和 Google 已发布的产品入口。

这对创作者和团队意味着什么?

如果你今天要做视频内容,最重要的问题不是“下一个模型叫什么”,而是“哪个工作流能减少废片,并让修改更可控”。

接下来值得关注的是这些能力:

  • 图生视频是否能稳定遵循参考图;
  • 人物、产品和 Logo 在多次修改中是否能保持一致;
  • 是否支持直接编辑已有视频,而不是每次重新生成;
  • 音频、对白和环境声是否能一起控制;
  • 首帧和尾帧能否用于控制镜头变化;
  • 是否有快速预览模型和高质量最终模型的组合;
  • 商用授权、水印、积分和配额规则是否清楚。

这些问题比模型名更影响日常创作。一个能可靠修改局部内容的模型,往往比一个只会生成惊艳首版的模型更有实际价值。

Google I/O 2026 应该重点看什么?

Google I/O 2026 是接下来最值得关注的窗口。真正有价值的信息不是宣传词,而是具体答案:

  • Gemini Omni 是否正式公布?
  • 它是模型、Gemini 功能、Flow 功能,还是多个能力的统一品牌?
  • 开发者能不能拿到 API 模型 ID?
  • 它是否支持视频改视频,还是只支持文生视频和图生视频?
  • Veo 这个品牌会继续保留在什么位置?
  • 价格、积分、配额和水印规则怎么设计?

在这些答案出现之前,最稳妥的路线是:需要稳定开发时看 Veo 3.1;需要观察下一波趋势时关注 Gemini Omni;至于 Veo 4,把它当作还没有落地的命名悬念。

参考资料

管理员

管理员