- Blog
- Veo 3 Prompt Guide: How to Write Prompts for Amazing AI Videos (2026)
Veo 3 Prompt Guide: How to Write Prompts for Amazing AI Videos (2026)
Veo 3 Prompt Guide: How to Write Prompts for Amazing AI Videos (2026)
Emma Chen · 3 min read · 21 hours ago

Veo 3 Prompt Guide: Wie man Prompts schreibt, die erstaunliche KI-Videos generieren (2026)
Der Unterschied zwischen einem mittelmäßigen Veo 3-Video und einem atemberaubenden liegt fast ausschließlich an deinem Prompt. Googles Veo 3 ist außergewöhnlich leistungsfähig, benötigt aber Anleitung — je klarer und spezifischer deine Anweisungen, desto besser dein Output.
Dieser Leitfaden behandelt alles, was du brauchst, um effektive Veo 3-Prompts zu schreiben: die Anatomie eines großartigen Prompts, bewährte Vorlagen, Techniken für spezifische Videotypen und häufige Fehler, die deine Ergebnisse ruinieren.

Verstehen, wie Veo 3 Prompts interpretiert
Veo 3 verarbeitet Prompts als einheitliche Beschreibung einer Szene — nicht als Liste von Befehlen. Es wurde mit großen Mengen an Video- und Filmmaterial trainiert, daher reagiert es gut auf kinematografische Sprache und narrative Beschreibung.
Stellen Sie sich vor, Sie sind ein Filmregisseur, der sein Team brieft. Sie beschreiben:
- Was sich in der Szene befindet (Subjekte, Objekte, Umgebung)
- Wie es aussieht (Beleuchtung, Farbe, Stil, Stimmung)
- Wie es sich bewegt (Kamerabewegung, Subjektbewegung, Tempo)
- Wie es klingt (Veo 3 generiert einzigartig Audio)
- Wie es sich anfühlt (emotionaler Ton, Atmosphäre)
Je spezifischer du jede dieser Dimensionen kommunizierst, desto mehr Kontrolle hast du über deinen Output.
Die Anatomie eines hochperformanten Veo 3-Prompts
Ein vollständiger Veo 3-Prompt hat fünf Komponenten:
[SUBJEKT] + [AKTION] + [UMGEBUNG] + [VISUELLER STIL] + [KAMERA/AUDIO]
Komponente 1: Subjekt
Wer oder was ist der Fokus? Sei spezifisch über:
- Aussehen (Alter, Kleidung, Ausdruck bei Personen; Farbe, Größe, Material bei Objekten)
- Position (Vordergrund, Bildmitte, Hintergrund)
- Anzahl (eine Person vs. eine Menschenmenge)
❌ Schwach: "eine Frau" ✅ Stark: "eine Frau in ihren frühen 30ern mit dunklem lockigem Haar, in einem cremefarbenen Leinensakko"
Komponente 2: Aktion
Was passiert? Beschreibe die Aktion in Präsens mit spezifischen Bewegungsdetails:
❌ Schwach: "durch eine Stadt gehen" ✅ Stark: "schnell durch eine regennasse Tokioter Straße gehen, Pfützen ausweichen, auf ihr Telefon schauen, Regenschirm gegen den Wind geneigt"
Komponente 3: Umgebung
Wo und wann? Einschließlich:
- Ortstyp (innen/außen, spezifischer Ort)
- Tageszeit und Jahreszeit
- Atmosphärische Bedingungen (Wetter, Umgebungslicht)
- Detailgrad des Hintergrunds
❌ Schwach: "draußen" ✅ Stark: "eine enge Kopfsteinpflaster-Gasse im alten Prag, goldene Stunde, warmes bernsteinfarbenes Licht filtert zwischen Gebäuden, entfernte Kirchenglocken hörbar"
Komponente 4: Visueller Stil
Wie sieht es aus? Spezifiziere:
- Ästhetische Referenz (Filmstil, Fotografiestil, Kunststil)
- Farbpalette (warm/kühl, gesättigt/entsättigt, spezifische Farben)
- Textur und Körnung (sauberes Digital, Filmkörnung, Weichzeichner)
- Gesamtstimmung (Dokumentation, kinematografisch, verträumt, rau)
❌ Schwach: "kinematografisch" ✅ Stark: "auf 35mm-Film gedreht, warme goldene Töne, leichte Körnung, geringe Schärfentiefe, erinnert an europäisches Kino der 1970er Jahre"
Komponente 5: Kamera und Audio
Wie wird es erfasst und wie klingt es?
Kamerabewegungsoptionen: statische Aufnahme, langsame Schwenk, Tracking-Aufnahme, Dolly-Zoom, Handkamera, Kranaufnahme, Luftaufnahme, Nahaufnahme, breite Establishing-Aufnahme
Audio (Veo 3 exklusiv): beschreibe Dialog, Umgebungsgeräusche, Musikstimmung
❌ Schwach: "Nahaufnahme" ✅ Stark: "langsamer Zoom von Mittelaufnahme zu Nahaufnahme, geringe Schärfentiefe zieht den Fokus auf ihre Augen. Sanfte Café-Umgebungsgeräusche, Jazz-Klavier im Hintergrund, gelegentliches Espresso-Maschinengeräusch"
Vollständige Prompt-Vorlagen nach Videotyp
Kinematografische Szenen-Vorlage
[Charakterbeschreibung] [Aktion im Detail] in [spezifischer Ort] während [Zeit/Wetter].
[Beleuchtungsbeschreibung]. Gedreht auf [Kamerastil], [Farbbehandlung].
[Kamerabewegung] von [Start-Framing] zu [End-Framing].
[Audio: Umgebungsgeräusche, Dialog falls vorhanden, Hintergrundmusik-Stimmung].
[Gesamtstimmung/Ton: melancholisch, triumphierend, mysteriös, etc.]
Beispiel:
Ein pensionierter Astronaut in seinen 70ern mit silbernem Haar und wettergegerbten Händen
ordnet alte Missionsfotografien sorgfältig auf einem Schreibtisch in einem schwach beleuchteten
Arbeitszimmer an. Warmes Lampenlicht wirft lange Schatten auf gerahmte Zertifikate und
Missionsabzeichen an der Wand. Gedreht auf 16mm, warme bernsteinfarbene und tiefe Schattenöne,
leichte Filmkörnung. Kamera schiebt sich langsam von Weitaufnahme zu Nahaufnahme seines
Ausdrucks — nostalgisch, stolz. Sanfte Instrumentalmusik im Hintergrund, gelegentliches
Ticken der Uhr, Papier raschelt sanft.
Produkt-/Werbespot-Vorlage
[Produktbeschreibung] auf [Oberfläche/Umgebung]. [Kamerabewegung] die [Funktion offenbart].
[Beleuchtung: professionelles Studio / natürlich / dramatisch].
[Farbe: neutral/Marke/dramatisch]. Fotorealistisch, [Auflösungsqualität].
[Markenästhetik]. [Beliebiges Audio: Umgebung, Musikstil, Voiceover falls nötig].
Beispiel:
Eine minimalistische weiße Keramik-Kaffeetasse mit Morgensonnenlicht, das einen sanften
Schatten auf einem Tisch aus Altholz wirft. Kamera umkreist die Tasse langsam um 180 Grad
und offenbart das Innere und die subtile Textur der Keramik. Sanftes natürliches Fenster-
licht von links, warm und diffus. Neutrale Weiß- und warme Holztöne, ultra sauber und
knackig. Café-Umgebungsgeräusche im Hintergrund, leichter Jazz, Espresso-Maschine in
der Ferne.
Action-/Sport-Vorlage
[Athletenbeschreibung] führt [spezifische Aktion] an [Ort] aus.
[Dynamische Kamerabewegung: Tracking, Zeitlupe-Spezifikation, etc.].
[Wetter-/Beleuchtungsbedingungen, die Drama hinzufügen].
[Energielevel: explosiv, fließend, anmutig].
[Audio: Menschenmenge, Aufprallgeräusche, Musikenergie].
Beispiel:
Eine weibliche Kletterin in ihren 20ern, Magnesium an ihren Händen, erklimmt eine
dramatische orange Sandsteinklippe bei Sonnenuntergang. Kamera verfolgt sie, während
sie einen schwierigen Zug macht, zieht sich dann zurück, um die atemberaubende
Wüstenlandschaft darunter zu offenbaren. Gedreht in Zeitlupe bei Schlüsselmomenten,
goldene Stunde Licht lässt den Stein leuchten. Geräusche von Wind, entfernten Vögeln,
das Kratzen von Kletterschuhen auf Stein. Atmosphärisch, aufbauende Orchestermusik.
Dialog-Szenen-Vorlage
[Charakter 1 Beschreibung] und [Charakter 2 Beschreibung] [Beziehungskontext] führen
ein Gespräch über [Thema]. [Umgebung]. [Emotionaler Subtext — was sie wirklich fühlen].
[Kamera: Abdeckungsstil, beliebige Bewegung].
[Audio: exakter Dialog falls gewünscht, oder Beschreibung des Sprachmusters, Umgebungsgeräusch].
Beispiel:
Zwei alte Freunde in ihren 60ern, ein Mann und eine Frau, sitzen sich in einer abgenutzten
Diner-Box gegenüber. Sie haben sich 20 Jahre nicht gesehen. Der Mann im Flanellhemd sagt
"Ich habe hundertmal daran gedacht, dich anzurufen." Die Frau, Finger um ihre Kaffeetasse
gewickelt, schaut aus dem Fenster und antwortet "Ich weiß. Ich auch." Lange Pause.
Diner-Umgebung — entferntes Klirren von Besteck, leises Murmeln anderer Gespräche,
Regen gegen das Fenster. Nahaufnahme zu zweit, langsam während der Stille hineinfahrend.
Natur-/Landschafts-Vorlage
[Landschaftsbeschreibung mit spezifischer Geografie]. [Tageszeit und Lichtqualität].
[Wetter- und Atmosphärenbedingungen]. [Beliebige Subjekte: Tiere, Menschen, Strukturen].
[Kamera: breite Establishing-Aufnahme, Luftaufnahme oder intime Bodenaufnahme].
[Bewegung: langsame Schwenk, Drohnen-Pullback, statisches Halten].
[Audio: natürliche Soundscape spezifisch für den Ort].
Beispiel:
Ein riesiger nebelhafter Wald aus alten Mammutbäumen in Nordkalifornien, frühmorgens
Nebel filtert durch das Blätterdach und fängt die ersten Sonnenstrahlen. Goldene
Lichtstrahlen durchdringen den Nebel zwischen massiven Stämmen. Ein einzelner Hirsch
pausiert in einer Lichtung, wachsam, Dampf steigt aus seinem Atem. Ultra-breite
Establishing-Aufnahme von Bodenniveau, Kamera hebt sich langsam, um das Waldblätterdach
zu offenbaren. Vögel rufen, Wind durch Blätter, entfernter Bach, absolute Stille
unterbrochen durch einzelnen Raubvogel-Ruf.
Fortgeschrittene Techniken
Technik 1: Referenziere echte Filme oder Fotografen
Veo 3 reagiert gut auf spezifische ästhetische Referenzen:
- "im Stil von Roger Deakins' Kinematografie"
- "erinnert an einen Terrence Malick-Film — naturalistisch, kontemplativ"
- "wie eine Wes Anderson-Szene — symmetrisch"
Related Articles
Continue with more blog posts in the same locale.

Veo 3 vs Runway Gen-4 (2026): Wer gewinnt bei KI-Videogenerierung?
Veo 3 vs Runway Gen-4 (2026): Wer gewinnt bei KI-Videogenerierung?
Read article
Veo 3 vs Midjourney Video: Welcher KI-Visual-Generator gewinnt 2026?
Veo 3 vs Midjourney Video: Welcher KI-Visual-Generator gewinnt 2026?
Read article
Veo 3 API-Leitfaden für Entwickler: KI-Videogenerierung integrieren (2026)
Veo 3 API-Leitfaden für Entwickler: KI-Videogenerierung integrieren (2026)
Read article