Gemini Omni AI 视频生成器

使用 Gemini Omni 创建和编辑视频。它是 Google 的多模态模型家族，可把文本、图片、视频以及语音或音频参考整合为连贯视频。你可以在 Veo3 AI 上从文本转视频或图片转视频开始。

文本转视频

提示词

Gemini Omni

0 / 5000

Gemini Omni 的核心差异

理解真实世界的科学与数学

Gemini Omni 可以把技术概念转成清晰的视频讲解。这个蛋白质折叠案例展示了模型在遵循黏土定格动画风格的同时，使用科学上下文来组织画面。

Prompt

claymation explainer of protein folding, everything is made out of clay, no hands, stop motion, accurate

让文字与画面动作同步

Gemini Omni 可以把动态文字、节奏、时机和镜头指令协调起来，适合教育短片、社媒视频、发布预告和以文字为核心的动态设计。

Prompt

word by word, one word on a the screen at a time: did, you, know, that, this, model, can, do, pretty, good, text!? each word appears with a different animated style, perfect pacing to a rhythm, sizzle reel

把多个输入融合进同一场景

Gemini Omni 可以结合手势、声音指令、视觉变换、灯光和环境约束，同时保留房间结构与场景连续性。

Prompt

Add harp sounds synchronized to when I touch each fern leaf. Change the leaf structure to all resemble semi translucent 3d bioluminescent plant life, with bioluminescent fireflies flying around it that react as I play, in sync with the sounds, subtle bokeh depth of field dynamic lighting, relecting off the walls in the room, keeping the room structure the same

让移动中的世界逐渐转换风格

Gemini Omni 可以在视频推进过程中把真实场景转成新的视觉语言，并结合图像风格参考与音频方向生成统一的复古未来感片段。

Prompt

Imagine the world gradually changing into retro futuristic style (grainy and moody as <image>) as I walk. Use the audio for a retro-futuristic background music. 10s.

根据参考角色进行人物替换

Gemini Omni 支持直接的人物变换提示词，可以把参考角色身份应用到源视频人物上，同时保持动作清楚、结果易读。

Prompt

turn me into this character

如何在 Veo3 AI 使用 Gemini Omni

像使用 Veo3 AI 其他旧模型页一样，从统一模型页工作流启动已接入的 Gemini Omni。

选择 Gemini Omni 模式

只有提示词时选择文本转视频；如果要动画化图片参考，则选择图片转视频。

清楚描述输出

写明主体、动作、镜头运动、风格、画幅、节奏，以及必须保持一致的参考细节。

生成并迭代

先生成第一条视频，检查结果，再通过提示词或参考素材继续强化运动、角色连续性和构图。

Gemini Omni 与其他视频模型对比

能力	Gemini Omni	Veo 3.1	Sora 2
最适合	多模态参考与对话式视频编辑	成熟的文本/图片生成电影感视频	可用时的高端提示词生视频风格
文本转视频
图片转视频
视频到视频编辑		随工作流而定	随工作流而定
官方产品中的原生音频			因入口而异
多轮编辑		提示词迭代	提示词迭代