Veo 3 Prompt Guide: How to Write Prompts for Amazing AI Videos (2026)

Veo 3 Prompt Guide: How to Write Prompts for Amazing AI Videos (2026)

E

Emma Chen · 3 min read · 21 hours ago

Veo 3 Prompt Guide: How to Write Prompts for Amazing AI Videos (2026)

Veo 3 Prompt Guide: Wie man Prompts schreibt, die erstaunliche KI-Videos generieren (2026)

Der Unterschied zwischen einem mittelmäßigen Veo 3-Video und einem atemberaubenden liegt fast ausschließlich an deinem Prompt. Googles Veo 3 ist außergewöhnlich leistungsfähig, benötigt aber Anleitung — je klarer und spezifischer deine Anweisungen, desto besser dein Output.

Dieser Leitfaden behandelt alles, was du brauchst, um effektive Veo 3-Prompts zu schreiben: die Anatomie eines großartigen Prompts, bewährte Vorlagen, Techniken für spezifische Videotypen und häufige Fehler, die deine Ergebnisse ruinieren.

Veo 3 Prompt Guide

Verstehen, wie Veo 3 Prompts interpretiert

Veo 3 verarbeitet Prompts als einheitliche Beschreibung einer Szene — nicht als Liste von Befehlen. Es wurde mit großen Mengen an Video- und Filmmaterial trainiert, daher reagiert es gut auf kinematografische Sprache und narrative Beschreibung.

Stellen Sie sich vor, Sie sind ein Filmregisseur, der sein Team brieft. Sie beschreiben:

  1. Was sich in der Szene befindet (Subjekte, Objekte, Umgebung)
  2. Wie es aussieht (Beleuchtung, Farbe, Stil, Stimmung)
  3. Wie es sich bewegt (Kamerabewegung, Subjektbewegung, Tempo)
  4. Wie es klingt (Veo 3 generiert einzigartig Audio)
  5. Wie es sich anfühlt (emotionaler Ton, Atmosphäre)

Je spezifischer du jede dieser Dimensionen kommunizierst, desto mehr Kontrolle hast du über deinen Output.

Die Anatomie eines hochperformanten Veo 3-Prompts

Ein vollständiger Veo 3-Prompt hat fünf Komponenten:

[SUBJEKT] + [AKTION] + [UMGEBUNG] + [VISUELLER STIL] + [KAMERA/AUDIO]

Komponente 1: Subjekt

Wer oder was ist der Fokus? Sei spezifisch über:

  • Aussehen (Alter, Kleidung, Ausdruck bei Personen; Farbe, Größe, Material bei Objekten)
  • Position (Vordergrund, Bildmitte, Hintergrund)
  • Anzahl (eine Person vs. eine Menschenmenge)

❌ Schwach: "eine Frau" ✅ Stark: "eine Frau in ihren frühen 30ern mit dunklem lockigem Haar, in einem cremefarbenen Leinensakko"

Komponente 2: Aktion

Was passiert? Beschreibe die Aktion in Präsens mit spezifischen Bewegungsdetails:

❌ Schwach: "durch eine Stadt gehen" ✅ Stark: "schnell durch eine regennasse Tokioter Straße gehen, Pfützen ausweichen, auf ihr Telefon schauen, Regenschirm gegen den Wind geneigt"

Komponente 3: Umgebung

Wo und wann? Einschließlich:

  • Ortstyp (innen/außen, spezifischer Ort)
  • Tageszeit und Jahreszeit
  • Atmosphärische Bedingungen (Wetter, Umgebungslicht)
  • Detailgrad des Hintergrunds

❌ Schwach: "draußen" ✅ Stark: "eine enge Kopfsteinpflaster-Gasse im alten Prag, goldene Stunde, warmes bernsteinfarbenes Licht filtert zwischen Gebäuden, entfernte Kirchenglocken hörbar"

Komponente 4: Visueller Stil

Wie sieht es aus? Spezifiziere:

  • Ästhetische Referenz (Filmstil, Fotografiestil, Kunststil)
  • Farbpalette (warm/kühl, gesättigt/entsättigt, spezifische Farben)
  • Textur und Körnung (sauberes Digital, Filmkörnung, Weichzeichner)
  • Gesamtstimmung (Dokumentation, kinematografisch, verträumt, rau)

❌ Schwach: "kinematografisch" ✅ Stark: "auf 35mm-Film gedreht, warme goldene Töne, leichte Körnung, geringe Schärfentiefe, erinnert an europäisches Kino der 1970er Jahre"

Komponente 5: Kamera und Audio

Wie wird es erfasst und wie klingt es?

Kamerabewegungsoptionen: statische Aufnahme, langsame Schwenk, Tracking-Aufnahme, Dolly-Zoom, Handkamera, Kranaufnahme, Luftaufnahme, Nahaufnahme, breite Establishing-Aufnahme

Audio (Veo 3 exklusiv): beschreibe Dialog, Umgebungsgeräusche, Musikstimmung

❌ Schwach: "Nahaufnahme" ✅ Stark: "langsamer Zoom von Mittelaufnahme zu Nahaufnahme, geringe Schärfentiefe zieht den Fokus auf ihre Augen. Sanfte Café-Umgebungsgeräusche, Jazz-Klavier im Hintergrund, gelegentliches Espresso-Maschinengeräusch"

Vollständige Prompt-Vorlagen nach Videotyp

Kinematografische Szenen-Vorlage

[Charakterbeschreibung] [Aktion im Detail] in [spezifischer Ort] während [Zeit/Wetter]. 
[Beleuchtungsbeschreibung]. Gedreht auf [Kamerastil], [Farbbehandlung]. 
[Kamerabewegung] von [Start-Framing] zu [End-Framing]. 
[Audio: Umgebungsgeräusche, Dialog falls vorhanden, Hintergrundmusik-Stimmung]. 
[Gesamtstimmung/Ton: melancholisch, triumphierend, mysteriös, etc.]

Beispiel:

Ein pensionierter Astronaut in seinen 70ern mit silbernem Haar und wettergegerbten Händen 
ordnet alte Missionsfotografien sorgfältig auf einem Schreibtisch in einem schwach beleuchteten 
Arbeitszimmer an. Warmes Lampenlicht wirft lange Schatten auf gerahmte Zertifikate und 
Missionsabzeichen an der Wand. Gedreht auf 16mm, warme bernsteinfarbene und tiefe Schattenöne, 
leichte Filmkörnung. Kamera schiebt sich langsam von Weitaufnahme zu Nahaufnahme seines 
Ausdrucks — nostalgisch, stolz. Sanfte Instrumentalmusik im Hintergrund, gelegentliches 
Ticken der Uhr, Papier raschelt sanft.

Produkt-/Werbespot-Vorlage

[Produktbeschreibung] auf [Oberfläche/Umgebung]. [Kamerabewegung] die [Funktion offenbart]. 
[Beleuchtung: professionelles Studio / natürlich / dramatisch]. 
[Farbe: neutral/Marke/dramatisch]. Fotorealistisch, [Auflösungsqualität]. 
[Markenästhetik]. [Beliebiges Audio: Umgebung, Musikstil, Voiceover falls nötig].

Beispiel:

Eine minimalistische weiße Keramik-Kaffeetasse mit Morgensonnenlicht, das einen sanften 
Schatten auf einem Tisch aus Altholz wirft. Kamera umkreist die Tasse langsam um 180 Grad 
und offenbart das Innere und die subtile Textur der Keramik. Sanftes natürliches Fenster-
licht von links, warm und diffus. Neutrale Weiß- und warme Holztöne, ultra sauber und 
knackig. Café-Umgebungsgeräusche im Hintergrund, leichter Jazz, Espresso-Maschine in 
der Ferne.

Action-/Sport-Vorlage

[Athletenbeschreibung] führt [spezifische Aktion] an [Ort] aus. 
[Dynamische Kamerabewegung: Tracking, Zeitlupe-Spezifikation, etc.]. 
[Wetter-/Beleuchtungsbedingungen, die Drama hinzufügen]. 
[Energielevel: explosiv, fließend, anmutig]. 
[Audio: Menschenmenge, Aufprallgeräusche, Musikenergie].

Beispiel:

Eine weibliche Kletterin in ihren 20ern, Magnesium an ihren Händen, erklimmt eine 
dramatische orange Sandsteinklippe bei Sonnenuntergang. Kamera verfolgt sie, während 
sie einen schwierigen Zug macht, zieht sich dann zurück, um die atemberaubende 
Wüstenlandschaft darunter zu offenbaren. Gedreht in Zeitlupe bei Schlüsselmomenten, 
goldene Stunde Licht lässt den Stein leuchten. Geräusche von Wind, entfernten Vögeln, 
das Kratzen von Kletterschuhen auf Stein. Atmosphärisch, aufbauende Orchestermusik.

Dialog-Szenen-Vorlage

[Charakter 1 Beschreibung] und [Charakter 2 Beschreibung] [Beziehungskontext] führen 
ein Gespräch über [Thema]. [Umgebung]. [Emotionaler Subtext — was sie wirklich fühlen]. 
[Kamera: Abdeckungsstil, beliebige Bewegung]. 
[Audio: exakter Dialog falls gewünscht, oder Beschreibung des Sprachmusters, Umgebungsgeräusch].

Beispiel:

Zwei alte Freunde in ihren 60ern, ein Mann und eine Frau, sitzen sich in einer abgenutzten 
Diner-Box gegenüber. Sie haben sich 20 Jahre nicht gesehen. Der Mann im Flanellhemd sagt 
"Ich habe hundertmal daran gedacht, dich anzurufen." Die Frau, Finger um ihre Kaffeetasse 
gewickelt, schaut aus dem Fenster und antwortet "Ich weiß. Ich auch." Lange Pause. 
Diner-Umgebung — entferntes Klirren von Besteck, leises Murmeln anderer Gespräche, 
Regen gegen das Fenster. Nahaufnahme zu zweit, langsam während der Stille hineinfahrend.

Natur-/Landschafts-Vorlage

[Landschaftsbeschreibung mit spezifischer Geografie]. [Tageszeit und Lichtqualität]. 
[Wetter- und Atmosphärenbedingungen]. [Beliebige Subjekte: Tiere, Menschen, Strukturen]. 
[Kamera: breite Establishing-Aufnahme, Luftaufnahme oder intime Bodenaufnahme]. 
[Bewegung: langsame Schwenk, Drohnen-Pullback, statisches Halten]. 
[Audio: natürliche Soundscape spezifisch für den Ort].

Beispiel:

Ein riesiger nebelhafter Wald aus alten Mammutbäumen in Nordkalifornien, frühmorgens 
Nebel filtert durch das Blätterdach und fängt die ersten Sonnenstrahlen. Goldene 
Lichtstrahlen durchdringen den Nebel zwischen massiven Stämmen. Ein einzelner Hirsch 
pausiert in einer Lichtung, wachsam, Dampf steigt aus seinem Atem. Ultra-breite 
Establishing-Aufnahme von Bodenniveau, Kamera hebt sich langsam, um das Waldblätterdach 
zu offenbaren. Vögel rufen, Wind durch Blätter, entfernter Bach, absolute Stille 
unterbrochen durch einzelnen Raubvogel-Ruf.

Fortgeschrittene Techniken

Technik 1: Referenziere echte Filme oder Fotografen

Veo 3 reagiert gut auf spezifische ästhetische Referenzen:

  • "im Stil von Roger Deakins' Kinematografie"
  • "erinnert an einen Terrence Malick-Film — naturalistisch, kontemplativ"
  • "wie eine Wes Anderson-Szene — symmetrisch"
Ready to create AI videos?
Turn ideas and images into finished videos with the core Veo3 AI tools.

Related Articles

Continue with more blog posts in the same locale.

Browse all posts