Prompts vidéo POV pour Veo 3 : générer des plans à la première personne (2026)

Comment écrire des prompts POV pour Veo 3 pour une vidéo immersive à la première personne : formule en 5 parties, 12 exemples prêts à l'emploi, son synchronisé et workflow vertical pour TikTok et Shorts.

E

Emma Chen · 19 min read · Jun 28, 2026

Prompts vidéo POV pour Veo 3 : générer des plans à la première personne (2026)

Une vue à la première personne où des mains entrent dans le cadre, entourée d'icônes doodle de caméra, de son et de vidéo verticale

Les vidéos POV (point of view, à la première personne) comptent parmi les formats les plus addictifs sur TikTok, Reels et YouTube Shorts en ce moment. Le spectateur ne regarde pas la scène — il est la scène. C'est lui qui franchit la porte, tient le couteau, agrippe le volant, jette un œil au coin du mur. C'est précisément cette sensation de « je suis à l'intérieur de ce moment » qui rend le contenu POV impossible à ignorer — et c'est exactement ce que Veo 3 sait offrir comme peu d'outils.

Comme Veo 3 génère un son natif et synchronisé en même temps que chaque clip, un plan à la première personne ne se contente pas de paraître immersif — il sonne immersif. Les pas se posent, le souffle se coupe, la pluie frappe le capot, une voix murmure juste à côté de « votre » oreille. C'est ce verrouillage image-son qui distingue un clip qui ressemble à une caméra d'un clip qui ressemble à vous-même.

Ce guide détaille précisément comment écrire des prompts POV pour Veo 3 : la formule de prompt, le vocabulaire de caméra que le modèle comprend, 12 exemples de prompts prêts à l'emploi pour les genres POV les plus populaires, comment superposer un son synchronisé et comment corriger les erreurs qui détruisent l'illusion de la première personne.

Ce que « POV » signifie vraiment pour Veo 3

Dans le langage du cinéma, un plan POV (point of view, à la première personne) montre le monde tel qu'un personnage le voit. La caméra remplace les yeux de quelqu'un. Vous ne voyez pas la personne — vous voyez ce qui se trouve devant elle, souvent avec ses mains, ses bras ou ses pieds qui entrent dans le cadre.

Veo 3 reconnaît « POV shot » et « first-person perspective » comme des instructions de caméra explicites. Selon les recommandations de prompting de Google elles-mêmes et les références cinématographiques sur lesquelles le modèle a été entraîné, nommer un type de plan — gros plan, plan de suivi, plan par-dessus l'épaule, vue aérienne ou POV — dirige la façon dont Veo cadre la scène. Lorsque vous écrivez « POV shot, first-person perspective », le modèle abaisse la caméra à hauteur des yeux, retire le personnage central du champ et laisse les mains et l'environnement raconter l'histoire.

C'est important, car par défaut Veo 3 produit un mouvement statique ou un léger flottement à main levée si vous ne décrivez pas la caméra. Le POV n'est pas un réglage par défaut : il faut le demander, et le demander avec précision. La bonne nouvelle : une fois la formule comprise, elle se répète à l'infini.

Pourquoi Veo 3 est bien adapté au contenu POV

Plusieurs capacités clés de Veo 3 correspondent presque parfaitement aux besoins de la vidéo à la première personne :

  • Son natif synchronisé. Veo 3 génère le son avec l'image — bruit ambiant, pas, manipulation d'objets, respiration et dialogue — le tout calé sur l'action. Le POV vit d'immersion, et l'immersion est à moitié faite de son. Pas besoin de chercher des bruitages séparément.
  • Contrôle cinématographique de la caméra par le langage. Les types de plan, le rendu de l'objectif et le mouvement se décrivent en français courant. Le POV est l'un des termes du vocabulaire de caméra que le modèle comprend directement.
  • Sortie en 1080p. Les clips sont rendus jusqu'en 1080p (avec des options de résolution supérieure sur Veo 3.1), assez nets pour que la main qui entre dans le cadre se lise comme une vraie peau et non comme une bavure.
  • Prise en charge du vertical 9:16. Le contenu POV est très majoritairement mobile. Veo 3 génère de vrais clips verticaux, pour ne pas recadrer une image horizontale et perdre les bords immersifs.
  • Clips de base de 8 secondes. Une génération unique dure jusqu'à environ 8 secondes, la durée naturelle d'un « moment » POV. Les récits plus longs s'assemblent à partir de plusieurs segments (voir plus bas).

L'anatomie d'un prompt POV Veo 3

Les prompts POV les plus efficaces suivent un squelette constant. Voyez-le comme cinq cases à remplir :

Les cinq blocs d'un prompt POV : plan à la première personne, corps dans le cadre, environnement, mouvement de caméra et son

  1. Déclaration du plan — établissez immédiatement le cadrage à la première personne. « POV shot, first-person perspective… »
  2. Qui vous êtes et ce que fait votre corps — les mains, bras ou pieds qui entrent dans le cadre, et l'action. « …mes mains tiennent une louche en bois, remuant une casserole de curry rouge bouillonnant… »
  3. Environnement et lumière — où vous êtes et à quoi cela ressemble. « …dans une cuisine chaleureuse et embuée, douce lumière d'après-midi par la fenêtre… »
  4. Comportement de la caméra — comment la « tête » bouge. « …la caméra s'incline vers la casserole, puis remonte vers la cuisinière, léger balancement naturel de la tête… »
  5. Son — le son synchronisé souhaité. « …bruits d'huile qui grésille, une cuillère qui tape le bord de la casserole, doux bouillonnement. »

Assemblé, cela donne un segment de 8 secondes net et immersif. L'erreur la plus courante est de n'écrire que les cases 1 et 3 (« plan POV dans une cuisine ») et de s'étonner que le résultat semble générique. Ce sont les mains et le son qui vendent la première personne.

Le vocabulaire de caméra POV que Veo 3 comprend

Vous pouvez empiler ces termes dans le prompt pour orienter le ressenti :

  • « First-person perspective » — renforce le fait que la caméra est les yeux du personnage.
  • « Eye-level camera » — maintient le cadrage à une hauteur humaine naturelle.
  • « Slight head-bob » / « natural handheld sway » — ajoute le léger mouvement qui rend un plan incarné plutôt que monté sur trépied.
  • « Hands enter frame from the bottom » — invite explicitement le corps dans le cadre, l'indice POV le plus important.
  • « The camera tilts down / pans left / looks up » — dirige où la « tête » se tourne.
  • « Shallow depth of field » / « background softly blurred » — imite la façon dont la mise au point humaine se resserre sur ce que vous tenez.
  • « GoPro-style wide angle » — pour le POV action et sport, donne ce rendu fisheye monté sur la poitrine.

Vous n'avez pas besoin de tous. Choisissez les deux ou trois qui collent au moment.

12 prompts POV Veo 3 prêts à l'emploi

Copiez-les, changez les détails et générez. Chacun est écrit comme un segment de 8 secondes avec un son synchronisé déjà intégré.

1. POV : cuisine

Vue à la première personne dans une cuisine : vos mains tranchent une tomate au rythme du hachage.

POV shot, first-person perspective. My hands hold a chef's knife, slicing a ripe red tomato on a wooden board in a bright home kitchen. Warm morning light through a window, steam rising from a pot in the soft-focus background. The camera tilts down to the board, slight natural head-bob. Audio: rhythmic chopping on wood, a pot gently bubbling, quiet kitchen ambience.

2. POV : voyage, balade en ville

Une marche dans une ruelle nocturne aux enseignes néon et aux reflets sur le pavé mouillé.

POV shot, first-person perspective walking through a narrow Tokyo alley at night. Neon signs glow pink and blue, reflections on wet pavement after rain. My shadow stretches ahead, slight head-bob with each step. Camera looks left toward a glowing ramen shop, then forward. Audio: footsteps on wet concrete, distant city hum, a sliding door, soft rain.

3. POV : conduite

Vue depuis le siège conducteur sur une route côtière à l'heure dorée, les mains sur le volant.

POV shot, first-person perspective from the driver's seat of a car on a coastal highway at golden hour. My hands rest on the steering wheel, the ocean glittering to the right through the windshield. Subtle handheld sway. Audio: engine hum, wind against the window, a faint song on the radio, the rhythmic click of a turn signal.

4. POV : jeu vidéo / réaction esport

À un bureau de gaming dans une pièce sombre éclairée par le clavier, penché en avant sous la tension.

POV shot, first-person perspective sitting at a gaming desk in a dark room lit by RGB keyboard glow. My hands rest on a mechanical keyboard and mouse, a glowing monitor in front. The camera leans slightly forward with tension. Audio: rapid mechanical key clicks, mouse clicks, a low desk-fan hum, an excited exhale.

5. POV : routine matinale (« un jour dans ma vie »)

Une main éteint le réveil puis ouvre les rideaux sur le soleil du matin.

POV shot, first-person perspective. My hand reaches out to silence a phone alarm on a nightstand, then pulls open soft white curtains to bright morning sun. The camera pans across a cozy bedroom. Slight natural sway. Audio: alarm tone cut short, curtain rings sliding on a rod, birds outside, a quiet yawn.

6. POV : horreur / thriller

Une lente avancée dans le couloir sombre d'une vieille maison, le faisceau de la lampe tremblant.

POV shot, first-person perspective slowly walking down a dim hallway in an old house, a flashlight beam trembling against peeling wallpaper. My hand grips the flashlight in the lower frame. The camera creeps forward, slight unsteady sway, then stops at a half-open door. Audio: slow footsteps on creaking wood, shallow nervous breathing, a distant thud, ringing silence.

7. POV : randonnée en nature

La montée d'un sentier forestier au matin, les chaussures enjambant pierres moussues et racines.

POV shot, first-person perspective hiking up a forest trail in the morning. My boots step over mossy rocks and roots, the camera tilts down to the path then up to sunlight breaking through tall pines. Natural head-bob with each stride. Audio: crunching gravel and leaves, steady breathing, birdsong, a light breeze through branches.

8. POV : barista / café

Derrière le comptoir d'un café : les mains tassent l'espresso et posent la tasse sous le bec.

POV shot, first-person perspective behind a cafe counter. My hands tamp espresso grounds into a portafilter, lock it into a gleaming machine, and place a white cup beneath the spout. Warm cafe lighting, soft-focus pastries in the background. Camera tilts to follow each action. Audio: the grind of beans, a hiss of steam, espresso trickling into the cup, low cafe chatter.

9. POV : déballage

À un bureau bien rangé, les mains ouvrent un carton et en sortent un casque neuf dans du papier.

POV shot, first-person perspective at a clean desk. My hands cut the tape on a brown cardboard box, fold open the flaps, and lift out a sleek pair of white headphones in tissue paper. Bright, even product lighting. The camera looks straight down at the box. Audio: a box cutter slicing tape, crinkling tissue paper, a soft click as the lid opens.

10. POV : fitness / salle de sport

En salle, les mains crayeuses agrippent la barre avant un soulevé concentré.

POV shot, first-person perspective in a gym, gripping a loaded barbell on the floor. My chalked hands tighten around the bar, the camera looks down at the weights then forward to a mirror. Slight tension and sway as I prepare to lift. Audio: a deep focused exhale, the clink of metal plates, muffled gym music, a faint grunt of effort.

11. POV style ASMR à la première personne

Les mains retirent lentement le film plastique d'un carnet neuf et feuillettent des pages vierges.

POV shot, first-person perspective at a desk in soft warm light. My hands slowly peel the plastic wrap off a new notebook, run fingers across the textured cover, and flip through crisp blank pages. Shallow depth of field. Audio: crinkling plastic, the soft crackle of pages, a gentle tap on the cover, quiet room tone.

12. POV : aventure / action style GoPro

Un plan grand-angle style GoPro : une descente en VTT sur un sentier forestier poussiéreux.

POV shot, first-person perspective, GoPro-style wide angle, mountain biking down a dusty forest trail. The handlebars and my gloved hands fill the lower frame, trees rushing past, dappled sunlight flickering. Fast natural motion and bumps. Audio: tires crunching dirt, wind rushing, the rattle of the bike frame, rapid breathing.

Superposer un son synchronisé au POV (l'étape que l'on saute)

C'est là que Veo 3 prend l'avantage pour le POV en particulier. Comme le modèle génère le son dans la même passe, vous pouvez décrire le paysage sonore — et il tombe en synchro avec l'image : des pas calés sur chaque pas, un coup de couteau calé sur chaque coupe.

Son natif synchronisé superposé à un clip POV, avec des couches sonores de pas, d'objets et d'ambiance

Quelques règles qui améliorent systématiquement le son POV :

  • Décrivez le son par couches, pas en un seul bloc. Nommez un son de premier plan (les pas), un son intermédiaire (l'objet manipulé) et une ambiance de fond (le bourdonnement de la ville, le son de la pièce). Trois couches se lisent comme un « véritable espace ».
  • Liez le son à l'action. « Couteau qui hache sur une planche en bois » bat « bruits de cuisine ». Un son concret, ancré dans l'action, se synchronise mieux.
  • Utilisez la respiration avec parcimonie mais avec force. Une seule « respiration nerveuse légère » ou un « expir concentré » ancre instantanément la première personne, car la respiration, vous seul l'entendez. N'en abusez pas — un indice de souffle par clip.
  • Évitez la musique dans le prompt pour un vrai POV. Les vrais moments à la première personne s'accompagnent rarement d'une bande-son. Générez un son diégétique propre, puis ajoutez la musique au montage si vous le souhaitez. (Si vous voulez de la musique dans la scène — une radio, un club — décrivez-la comme venant d'une source : « une chanson lointaine à la radio ».)

Pour approfondir le son diégétique propre, voyez notre article sur le prompting du son natif de Veo 3 et l'explication de comment fonctionne la génération audio de Veo 3.

Erreurs POV courantes (et la solution)

Erreur : le personnage apparaît dans le cadre. Vous avez demandé un POV mais le résultat montre une personne de l'extérieur. Solution : dites-le deux fois — « POV shot, first-person perspective » en tête, et « la caméra ne montre que mes mains et ce qui est devant moi » plus loin. Retirer le personnage central, c'est tout l'enjeu.

Erreur : pas de mains, donc on dirait un drone. Un plan à la première personne sans corps dans le cadre ressemble à une caméra flottante. Solution : incluez toujours les mains/bras/pieds qui entrent dans le cadre et ce qu'ils font. Le corps, c'est le POV.

Erreur : la caméra est trop lisse. Un mouvement parfaitement stabilisé se lit comme un gimbal, pas comme une tête humaine. Solution : ajoutez « slight natural head-bob » ou « subtle handheld sway ». Pour l'action, allez plus loin : « fast bumps, GoPro-style ».

Erreur : un son générique. « Bruits de cuisine » produit une bouillie vague. Solution : ancrez chaque son à une action précise et empilez trois couches.

Erreur : vouloir caser une histoire en 8 secondes. Le POV fonctionne comme un moment vif, pas comme une intrigue. Solution : un lieu, une action, un segment par clip. Construisez les séquences par assemblage (section suivante).

Construire des séquences POV plus longues

Une génération Veo 3 unique plafonne à environ 8 secondes, ce qui suffit pour un segment POV. Pour raconter une « histoire POV » plus longue — POV : une journée de barista, POV : rentrer sous la pluie — vous assemblez plusieurs segments :

  1. Faites le storyboard des segments. Écrivez 3 à 5 prompts POV distincts, chacun un moment précis (ouvrir la porte → accrocher le manteau → lancer le café → s'asseoir près de la fenêtre).
  2. Gardez le « vous » constant. Utilisez la même description de mains, les mêmes vêtements et le même style de lumière dans tous les prompts pour que le spectateur croie à une seule personne continue. Des formules comme « mes mains avec une montre noire au poignet gauche » portent l'identité de clip en clip.
  3. Générez chaque segment, puis assemblez-les au montage dans l'ordre narratif.
  4. Prolongez si besoin. Veo 3.1 prend en charge la prolongation d'un clip et l'enchaînement de scènes pour des plans continus plus longs — utile quand une action demande plus de 8 secondes. Voyez notre guide pour prolonger les vidéos Veo 3 au-delà de 8 secondes.
  5. Ajoutez un seul lit musical sous toute la séquence en post-production si le format l'exige, en gardant le son diégétique en dessous.

Comme les segments POV sont courts et autonomes, ce flux d'assemblage est rapide — et c'est exactement ainsi que se construisent les séquences virales « POV : … » sur TikTok et Shorts.

Le POV en vertical : TikTok, Reels et Shorts

Presque tout le contenu POV se consomme en vertical, et Veo 3 génère des clips natifs 9:16, alors demandez le vertical explicitement. Ajoutez « vertical 9:16 framing » à n'importe lequel des prompts ci-dessus et le modèle compose pour le cadre haut — en gardant les mains et l'action clé centrées là où l'écran du téléphone les montre. Ne générez pas en horizontal pour recadrer ; vous perdriez les bords gauche et droit immersifs qui rendent la première personne large et présente. Pour le détail complet, voyez notre guide de la vidéo verticale Veo 3.

Une courte checklist pour un POV vertical qui performe :

  • Une accroche dès la première seconde — l'action la plus marquante en haut (la main qui se tend, la porte qui s'ouvre).
  • Gardez l'objet important dans le tiers central du cadre.
  • Utilisez aussi le son synchronisé comme accroche ; un son satisfaisant dans le premier segment stoppe le défilement.
  • Terminez sur un moment « facile à boucler » pour que le clip se rejoue proprement.

Comment Veo 3 se compare spécifiquement pour le POV

Beaucoup d'outils vidéo IA savent rendre un plan à la première personne, mais le POV est exceptionnellement exigeant sur le son — et c'est l'avantage de Veo 3. La bande-son native synchronisée fait qu'un clip POV de cuisine arrive avec le hachage et le grésillement déjà calés sur l'image, alors que beaucoup de modèles concurrents produisent une vidéo muette à sonoriser ensuite à la main. La solide compréhension par Veo 3 du vocabulaire cinématographique (il interprète de façon fiable « POV shot », « eye-level », « head-bob ») fait aussi que vous passez moins de temps à lutter contre la caméra et plus à itérer sur le moment. Si vous comparez les options, notre comparatif des meilleurs générateurs vidéo IA place Veo 3 face au reste du marché.

Foire aux questions

Veo 3 comprend-il réellement le « POV » ? Oui. POV (point of view, à la première personne) est un terme cinématographique standard et l'un des types de plan auxquels Veo 3 répond directement. Associez-le à « first-person perspective » et à une description explicite des mains qui entrent dans le cadre pour le résultat le plus fiable.

Pourquoi mon clip POV montre-t-il encore le personnage de l'extérieur ? Le modèle bascule parfois vers une vue à la troisième personne quand le prompt est ambigu. Renforcez la première personne deux fois, ne décrivez que les mains/parties du corps qui doivent apparaître, et dites explicitement que la caméra montre « ce qui est devant moi ». Si cela persiste, régénérez — la variation entre les essais est normale.

Comment faire pour que la caméra ressemble à une vraie tête, pas à un trépied ? Ajoutez des indices de mouvement : « slight natural head-bob », « subtle handheld sway » ou, pour l'action, « GoPro-style, fast bumps ». Sans description de mouvement, Veo 3 tend vers le statique ou un mouvement à peine perceptible.

Puis-je obtenir des pas et une respiration synchronisés ? Oui — c'est une force majeure de Veo 3. Décrivez le son par couches et ancrez chaque son à une action (« pas sur du béton mouillé », « respiration nerveuse légère »). Le son est généré en synchro avec l'image dans la même passe.

Quelle peut être la durée d'un clip POV ? Une génération unique dure jusqu'à environ 8 secondes. Pour des histoires POV plus longues, générez plusieurs segments et assemblez-les, ou utilisez la fonction de prolongation de Veo 3.1 pour enchaîner les scènes.

Dois-je générer le POV en vertical ou en horizontal ? En vertical (9:16) pour TikTok, Reels et Shorts — demandez-le explicitement dans le prompt plutôt que de recadrer un clip horizontal. N'utilisez l'horizontal que si la destination finale est YouTube en format paysage ou un site web.

Puis-je garder la même « personne » sur plusieurs clips ? Utilisez des indices de corps et de tenue constants — les mêmes mains, montre, couleur de manche et lumière — dans chaque prompt. Cette continuité convainc les spectateurs qu'il s'agit d'une seule personne sur toute la séquence assemblée.

Commencez à filmer par les yeux d'un autre

Le POV est l'un des formats les plus engageants de la vidéo courte, et Veo 3 est exceptionnellement bien équipé pour lui : il comprend le langage de la caméra à la première personne, il met vos mains dans le cadre et — c'est crucial — il génère le son synchronisé qui rend l'immersion crédible. Commencez par l'un des 12 prompts ci-dessus, insérez votre propre scène, demandez le cadrage vertical et superposez le son en trois couches. Puis assemblez quelques segments en une séquence « POV : … » et vous obtenez un contenu qui stoppe le défilement, monté en quelques minutes.

Le moyen le plus rapide d'apprendre ce qui marche, c'est de générer, regarder, changer une variable et régénérer. Ouvrez Veo 3, glissez-y un prompt POV et placez votre spectateur juste derrière vos yeux.

Ready to create AI videos?
Turn ideas and images into finished videos with the core Veo3 AI tools.

Related Articles

Continue with more blog posts in the same locale.

Browse all posts