Générateur de prompts JSON Veo 3 : guide des prompts structurés et modèles (2026)

Cessez d'espérer de bons résultats avec Veo 3 — concevez-les. Le guide complet 2026 du prompting JSON : anatomie des champs, 4 modèles à copier, image-to-video et l'astuce de cohérence.

E

Emma Chen · 13 min read · Jun 25, 2026

Générateur de prompts JSON Veo 3 : guide des prompts structurés et modèles (2026)

La plupart des gens tapent une seule phrase dans Veo 3, croisent les doigts et espèrent que le modèle devinera ce qu'ils voulaient dire. Parfois, ça tombe juste. Mais le plus souvent, la caméra dérive, l'éclairage change d'un plan à l'autre, la veste du personnage change soudain de couleur, et le son n'a rien à voir avec ce que vous aviez imaginé. La solution adoptée par les créateurs avancés en 2026 n'est pas une phrase plus longue, c'est un prompt JSON. Au lieu d'un seul paragraphe d'un bloc, vous remettez à Veo 3 un objet structuré qui nomme chaque réglage séparément : sujet, action, caméra, objectif, éclairage, couleur, son et style. Le modèle cesse de deviner et se met à suivre des instructions.

Ce guide est la référence complète du prompting JSON dans Veo 3, à copier et utiliser directement. Vous découvrirez ce qu'est réellement un prompt JSON, pourquoi le format structuré produit des résultats plus cohérents que le texte libre, vous parcourrez l'anatomie complète d'un objet-prompt Veo 3 champ par champ, et vous obtiendrez quatre modèles prêts à l'emploi à coller directement dans Veo 3 dès aujourd'hui. Si vous écrivez encore vos prompts sous forme de paragraphes, c'est la seule amélioration qui changera le plus votre taux de réussite. Tout nouveau dans le prompting ? Parcourez d'abord notre guide d'ingénierie de prompts pour Veo 3, puis revenez ici pour passer aux prompts structurés.

Qu'est-ce qu'un prompt JSON ?

JSON (JavaScript Object Notation) est une manière simple et lisible d'écrire des données structurées sous forme de paires clé-valeur. Un prompt JSON pour Veo 3 reprend la même idée que vous entassez d'habitude dans une seule phrase et la décompose en champs nommés :

{
  "shot": "medium close-up",
  "subject": "a barista with curly red hair and a green apron",
  "action": "steams milk, then looks up and smiles at the camera",
  "setting": "a sunlit specialty coffee shop, morning",
  "camera": "slow push-in on a 50mm lens, shallow depth of field",
  "lighting": "warm window light from the left, soft shadows",
  "audio": "hiss of the steam wand, low cafe chatter, no music",
  "style": "photorealistic, cinematic, 35mm film grain"
}

Comparez cela à la version en paragraphe : « Une barista aux cheveux roux bouclés et au tablier vert fait mousser du lait dans un café baigné de soleil, puis lève les yeux et sourit, filmée avec un objectif 50 mm en lent travelling avant et une lumière chaude de fenêtre, avec le sifflement de la buse vapeur et le brouhaha feutré du café. » Les deux décrivent la même scène. Mais dans la version JSON, chaque instruction est séparée, si bien que le modèle ne fond pas « lumière chaude de fenêtre à gauche » dans la description du sujet et n'oublie pas l'indication sonore enfouie à la fin d'une longue phrase. Chaque clé est un canal d'intention bien net.

Veo 3 n'exige pas de schéma formel — le modèle lit les valeurs en langage naturel à l'intérieur de l'objet —, mais le fait même de structurer vous force à expliciter ce que vous laisseriez sinon dans le flou. C'est de cette clarté que naît le bond de qualité.

Pourquoi les prompts JSON fonctionnent mieux dans Veo 3

Trois raisons concrètes pour lesquelles les prompts structurés battent les paragraphes, surtout sur un modèle comme Veo 3 qui génère l'image et le son natif en une seule passe :

1. Rien ne se perd. Dans une longue phrase, le modèle pondère le plus fortement les mots vus en premier et en dernier. Les indications sonores, le choix d'objectif et l'étalonnage colorimétrique glissés au milieu d'un paragraphe sont régulièrement ignorés. En JSON, chaque instruction occupe son propre champ avec un poids égal, de sorte que vos champs audio et lighting reçoivent autant d'attention que le sujet.

2. La cohérence d'un plan à l'autre. C'est le point capital. Si vous gardez les champs subject, style et lighting identiques sur plusieurs générations en ne changeant que action et camera, vous obtenez un personnage reconnaissable et cohérent ainsi qu'un rendu uniforme d'un plan à l'autre. C'est la base pour assembler des plans en une séquence plus longue — voyez notre tutoriel sur la façon de prolonger Veo 3 au-delà de 8 secondes, où ce sont précisément des blocs JSON stables qui empêchent le personnage de « se déformer » à mi-parcours.

3. Reproductibilité et itération. Comme le prompt est structuré, vous pouvez modifier une variable à la fois et comprendre réellement ce que fait chaque champ. Passez lighting de « chaud » à « haute clé » et relancez. Changez camera de « statique » à « lent travelling avant » et relancez. Vous bâtissez une boucle de rétroaction contrôlée au lieu de réécrire tout un paragraphe en vous demandant quel mot a fait bouger les choses.

L'anatomie d'un prompt JSON Veo 3

Voici l'ensemble complet des champs qui fonctionnent de façon fiable avec Veo 3 en 2026. Vous n'avez pas besoin de tous les champs sur chaque prompt — utilisez ce que le plan exige —, mais voici la liste complète, regroupée par fonction.

Scène principale

  • shot — cadrage : extreme wide, wide, medium, medium close-up, close-up, macro.
  • subject — qui ou quoi, décrit avec des détails visuels précis et durables (cheveux, tenue, âge, carrure). À réutiliser mot pour mot pour la cohérence.
  • action — ce qui se passe, dans l'ordre chronologique. Utilisez des mots de séquence : « d'abord… ensuite… ».
  • setting — le lieu, plus le moment de la journée et la météo.

Caméra et objectif

  • camera — mouvement : static, slow push-in, dolly-out, handheld, crane up, orbit. Le vocabulaire complet se trouve dans notre guide des prompts de contrôle de caméra.
  • lens18mm wide, 35mm, 50mm, 85mm portrait, plus shallow ou deep depth of field.

Lumière et couleur

  • lighting — direction, qualité et source : « lumière clé douce à droite, contre-jour derrière, néon pratique ».
  • color / color_grade — palette et ambiance : « turquoise et orange », « pastel feutré », « noir contrasté ».

Son (la superpuissance de Veo 3)

  • audio — décrivez tout le mixage : ambiance, effets sonores et musique séparément. Précisez explicitement quand vous voulez du silence ou pas de musique.
  • dialogue — la réplique exacte entre guillemets. Veo 3 fera la synchronisation labiale. Gardez les répliques courtes pour un plan de 8 secondes. Notre guide du son natif approfondit ce champ.

Style et finition

  • style — esthétique globale : photorealistic, cinematic, documentary, claymation, anime, 35mm film.
  • aspect_ratio16:9, 9:16 pour le format vertical, 1:1.
  • negative — ce qu'il faut éviter : « pas d'incrustation de texte, pas de mains déformées, pas de doigts en trop ». Plus de détails dans le guide des prompts négatifs.

Quatre modèles JSON à copier

Voici des points de départ complets et fonctionnels. Collez-en un dans Veo 3, puis remplacez les valeurs pour votre scène.

1. Présentation de produit (e-commerce / publicité)

{
  "shot": "macro to medium pull-back",
  "subject": "a matte-black wireless earbud case on a wet slate surface",
  "action": "the lid slowly opens, the earbuds glow, then the camera pulls back to reveal the full product",
  "setting": "minimalist studio, dark background",
  "camera": "slow dolly-out on a 100mm macro lens, rack focus",
  "lighting": "single soft top light, subtle blue rim light",
  "color_grade": "high-contrast, cool blues and silver",
  "audio": "a soft mechanical click as the lid opens, a low ascending synth swell, no voiceover",
  "style": "premium commercial, photorealistic, glossy reflections",
  "aspect_ratio": "16:9",
  "negative": "no text, no logos, no hands"
}

2. Dialogue cinématographique (synchronisation labiale)

{
  "shot": "medium close-up",
  "subject": "a weary detective in a damp trench coat, 50s, stubble",
  "action": "he leans against a brick wall, exhales, and speaks directly to camera",
  "setting": "a rain-soaked alley at night, neon signs reflecting in puddles",
  "camera": "slow handheld push-in on an 85mm lens, shallow depth of field",
  "lighting": "magenta and cyan neon practicals, hard rim light, deep shadows",
  "dialogue": "\"Everybody in this city is running from something. Tonight, it's my turn.\"",
  "audio": "steady rain, distant traffic, a low ominous drone, no music bed",
  "style": "neo-noir, cinematic, 35mm film grain",
  "aspect_ratio": "16:9"
}

3. Clip vertical pour les réseaux sociaux (TikTok / Reels)

{
  "shot": "medium",
  "subject": "an energetic fitness coach in bright activewear",
  "action": "demonstrates a kettlebell swing with perfect form, then points at the camera and gives a thumbs up",
  "setting": "a sunlit home gym with plants",
  "camera": "static tripod, eye level, then a quick snap zoom on the thumbs up",
  "lighting": "bright natural daylight, clean and high-key",
  "audio": "upbeat energetic background music, a rhythmic exhale on each swing",
  "dialogue": "\"Three sets of fifteen — let's go!\"",
  "style": "vibrant, modern, social-media polish",
  "aspect_ratio": "9:16",
  "negative": "no warped equipment, no extra limbs"
}

4. Plan de série avec personnage cohérent

Figez subject, style et lighting ; entre les générations, ne changez que action et camera.

{
  "shot": "medium",
  "subject": "Mira, a young astronaut with a buzzcut and a scar over her left eyebrow, wearing a worn orange flight suit",
  "action": "checks a wrist console, frowns, then looks off-screen toward an alarm",
  "setting": "the cramped cockpit of a derelict spaceship, red emergency lighting",
  "camera": "slow orbit to the right on a 35mm lens",
  "lighting": "pulsing red emergency light, faint blue glow from the console",
  "audio": "low hum of failing systems, an intermittent alarm beep, tense ambient drone",
  "style": "sci-fi, cinematic, photorealistic, film grain",
  "aspect_ratio": "16:9"
}

Les prompts JSON avec une image de référence (image-to-video)

La structuration JSON brille tout autant lorsque vous partez d'une image plutôt que d'un texte pur. Quand vous téléversez une image de référence, celle-ci verrouille déjà l'apparence du sujet, sa tenue et le décor — vous pouvez donc supprimer la lourde description de subject et setting et consacrer vos champs au mouvement et à la caméra. L'image gère le « à quoi ça ressemble » ; le JSON gère le « ce que ça fait ».

{
  "input": "uploaded reference image of the character",
  "action": "the character turns their head toward the window, then breaks into a slow smile",
  "camera": "gentle handheld drift, slight push-in on a 50mm lens",
  "lighting": "match the soft window light in the reference image",
  "audio": "quiet room tone, a soft inhale, distant birdsong, no music",
  "style": "preserve the photographic style of the reference image",
  "negative": "do not change the character's face, hair, or clothing"
}

Remarquez comment lighting et style disent match et preserve au lieu de redécrire la scène — cela ancre Veo 3 sur votre image au lieu de la réinventer. Le champ negative qui fait le travail de protection de l'identité (« ne pas changer le visage ») est l'une des lignes les plus efficaces que vous puissiez écrire pour l'image-to-video. Pour le flux de travail complet avec image de référence, voyez notre guide de l'image-to-video dans Veo 3.

Avancé : ordre et regroupement des champs

Deux raffinements distinguent les bons prompts JSON des excellents. D'abord, l'ordre des champs est un signal léger — placez l'instruction la plus importante en haut. Si l'identité du personnage compte le plus, commencez par subject ; si le mouvement de caméra est le héros du plan, commencez par camera. Ensuite, pour les scènes complexes, vous pouvez regrouper les valeurs liées dans des objets imbriqués afin que chaque groupe se lise proprement :

{
  "subject": "a street violinist, late 20s, fingerless gloves",
  "action": "plays an energetic solo, eyes closed",
  "camera": { "movement": "slow arc left", "lens": "35mm", "depth_of_field": "shallow" },
  "lighting": { "key": "golden hour backlight", "fill": "soft bounce from the right" },
  "audio": { "music": "a fast, emotional solo violin", "ambient": "city street, faint applause", "sfx": "none" }
}

Veo 3 lit sans problème les valeurs imbriquées, et le regroupement rend évident d'un coup d'œil ce que vous avez précisé et ce que vous avez laissé au modèle. Utilisez des champs plats pour les plans simples et des objets imbriqués uniquement lorsqu'une section comporte réellement plusieurs sous-valeurs — sur-imbriquer un prompt simple ne fait qu'ajouter du bruit.

Comment utiliser un prompt JSON dans Veo 3

Vous n'avez besoin d'aucun mode spécial. Veo 3 accepte l'objet JSON directement dans le même champ de prompt où vous taperiez une phrase :

  1. Ouvrez Veo 3 sur veo3ai.io (ou Google Flow si vous préférez la vue storyboard).
  2. Collez votre objet JSON complet dans le champ de prompt. Gardez un JSON valide — accolades appariées, valeurs entre guillemets, virgules entre les champs.
  3. Réglez la durée du clip et le format si l'interface les propose séparément ; sinon, le champ aspect_ratio à l'intérieur du JSON fait le travail.
  4. Générez, examinez, puis itérez en changeant un champ à la fois.
  5. Pour bâtir une séquence, dupliquez le JSON, gardez subject/style/lighting figés et ne modifiez que action et camera pour le plan suivant.

C'est exactement cette discipline des blocs figés qui permet aux créateurs de garder un personnage « dans le rôle » sur une vidéo à plusieurs plans, ce qui est le préalable à tout ce qui dépasse un seul clip.

Les générateurs de prompts JSON : en avez-vous besoin ?

Une vague d'outils gratuits de « générateur de prompts JSON pour Veo 3 » est apparue en 2026 — ils proposent un formulaire avec des menus déroulants pour le plan, la caméra et la lumière, puis exportent le JSON à votre place. Ils sont pratiques pour les débutants qui ne veulent pas écrire d'accolades à la main, et pour parcourir des bibliothèques de prompts préconçues. Mais une fois que vous maîtrisez l'anatomie des champs ci-dessus, écrire le JSON soi-même est plus rapide et bien plus souple que de cliquer dans le formulaire d'autrui. Le schéma de ce guide est le générateur — gardez-le ouvert dans un onglet, copiez le modèle le plus proche de votre plan et modifiez les valeurs. La vraie compétence, ce n'est pas l'outil ; c'est de savoir quels champs actionnent quels réglages, et c'est ce que vous avez désormais.

Erreurs courantes en prompting JSON

  • JSON invalide. Une virgule manquante ou une accolade non appariée peut amener le modèle à se rabattre sur la lecture de l'objet comme un texte brouillon. En cas de doute, collez votre objet dans n'importe quel validateur JSON gratuit avant de générer.
  • Surcharger un seul champ. N'écrivez pas un paragraphe dans action. Répartissez les idées distinctes dans les bonnes clés — le mouvement va dans camera, l'ambiance dans lighting et color_grade.
  • Oublier le son. Le son natif de Veo 3 est son plus grand atout face aux modèles plus anciens. Un champ audio vide ou absent le gaspille. Précisez toujours l'ambiance, les effets et si vous voulez de la musique.
  • Dialogue trop long. Un clip de 8 secondes contient environ une à deux courtes phrases de parole. Entassez-y un monologue et la synchronisation labiale s'emballe ou se coupe.
  • Tout changer d'un coup. Quand un résultat est proche mais pas parfait, ne réécrivez pas tout l'objet. Changez un champ, relancez, tirez-en une leçon.

JSON contre texte libre : quand utiliser quoi

Les prompts en texte restent parfaitement adaptés aux idées rapides, simples et à un seul plan où le contrôle exact vous importe peu — « un golden retriever court sur une plage au coucher du soleil » sera superbe de toute façon. Optez pour le JSON quand vous avez besoin de précision (objectif, lumière, couleur précis), de cohérence (le même personnage ou rendu sur plusieurs clips) ou d'itération reproductible (changer une variable à la fois). En pratique : expérimentez librement en texte, puis figez votre idée gagnante dans un objet JSON pour la reproduire et la prolonger de façon fiable. Pour une bibliothèque plus large d'idées en texte à convertir en JSON, consultez notre guide des meilleurs prompts Veo 3.

Foire aux questions

Veo 3 prend-il officiellement en charge les prompts JSON ? Veo 3 n'impose pas de schéma JSON formel, mais il analyse de façon fiable les objets JSON structurés, car les valeurs en langage naturel à l'intérieur de chaque champ sont exactement ce que le modèle lit. La structure est là pour votre bénéfice — elle force des instructions explicites et séparées — et donne en pratique des résultats nettement plus contrôlables que les paragraphes.

Le prompting JSON est-il meilleur qu'une phrase détaillée ? Pour les plans complexes ou reproductibles, oui. Le format empêche les instructions de se perdre et rend la cohérence entre clips bien plus facile. Pour une idée simple et ponctuelle, une bonne phrase suffit.

Quels champs comptent le plus pour la cohérence ? subject, style et lighting. Gardez ces trois-là identiques d'une génération à l'autre et ne changez que action et camera pour que le personnage et le rendu restent « dans le rôle » d'un plan à l'autre.

Puis-je utiliser des prompts JSON pour des vidéos verticales TikTok et Reels ? Oui — réglez "aspect_ratio": "9:16" à l'intérieur de l'objet. Le modèle 3 ci-dessus est un point de départ vertical prêt à l'emploi.

Ai-je besoin d'un générateur de prompts JSON ? Non. Les modèles et la liste de champs de ce guide couvrent ce que produisent les générateurs. Modifier un modèle à la main est plus rapide et plus souple dès que vous connaissez les champs.

Puis-je utiliser des prompts JSON en partant d'une image ? Oui, et c'est souvent le flux le plus propre. Laissez l'image téléversée définir l'apparence et le décor, et utilisez vos champs JSON pour action, camera et une ligne negative qui protège l'identité du personnage. Voyez le modèle image-to-video ci-dessus.

Quelle longueur peut avoir le dialogue dans un prompt JSON ? Gardez les répliques courtes — environ une à deux courtes phrases pour un clip standard de 8 secondes. Des répliques plus longues forcent la synchronisation labiale à s'emballer ou à se couper. S'il vous faut plus de dialogue, répartissez-le sur des clips successifs avec un bloc subject figé.

Le même prompt JSON produira-t-il toujours la même vidéo ? Pas exactement — Veo 3 introduit toujours de la variation entre les générations. Mais un prompt bien structuré réduit drastiquement cette variation, et figer subject, style et lighting garde le rendu assez cohérent pour assembler les clips.

Commencez à prompter avec de la structure

Le prompting JSON, c'est la différence entre espérer un bon résultat Veo 3 et le concevoir. Choisissez le modèle le plus proche de votre plan, collez-le dans Veo 3 et changez un champ à la fois jusqu'à ce que tout sonne juste. Une fois que vous maîtrisez couramment l'anatomie des champs, vous ne reviendrez jamais à la lutte contre les longs paragraphes — et vos personnages, votre lumière et votre son resteront enfin exactement là où vous les avez placés. Pour passer au niveau supérieur, associez ceci à notre guide des prompts cinématographiques et commencez à bâtir des séquences à plusieurs plans qui tiennent vraiment ensemble.

Ready to create AI videos?
Turn ideas and images into finished videos with the core Veo3 AI tools.

Related Articles

Continue with more blog posts in the same locale.

Browse all posts