- Blog
- Workflow de référence d’image Veo 3 2026 : garder des personnages et produits cohérents
Workflow de référence d’image Veo 3 2026 : garder des personnages et produits cohérents
Un workflow pratique de référence d’image Veo 3 pour garder produits, personnages, mascottes et visuels de marque cohérents d’un plan vidéo IA à l’autre.
Emma Chen · 19 min read · May 1, 2026

Workflow de référence d’image Veo 3 2026 : garder les personnages et les produits cohérents

La référence d’image est l’un des workflows les plus utiles pour Veo 3, car de nombreux projets vidéo échouent pour une raison simple : le sujet change. Un personnage a une apparence différente d’un plan à l’autre. L’étiquette d’un produit se déforme. Une mascotte perd sa forme. Un emballage change de couleur. Un avatar de fondateur devient une autre personne. Un lieu commence avec une direction d’éclairage et se termine avec une autre. La vidéo peut paraître impressionnante, mais elle est difficile à utiliser dans une vraie campagne, car l’identité visuelle est instable.
Un workflow de référence d’image Veo 3 résout ce problème en traitant l’image de référence comme l’ancre de la scène. Au lieu de demander au modèle d’inventer tout à partir du texte, vous partez d’une fiche personnage, d’une photo produit, d’une maquette d’emballage, d’une image de storyboard, d’un visuel de marque ou d’une image clé validée. Ensuite, le prompt indique à Veo 3 ce qui doit bouger tout en protégeant l’identité du sujet. L’objectif n’est pas seulement d’obtenir une vidéo plus belle. L’objectif est d’obtenir une continuité utilisable.
Ce guide se concentre sur la cohérence pratique : comment préparer des images de référence, comment écrire des prompts qui préservent les personnages et les produits, comment planifier des séquences de plans, comment évaluer les sorties et comment construire un processus de revue répétable. Il s’adresse aux spécialistes marketing, aux équipes ecommerce, aux créateurs, aux agences, aux enseignants, aux équipes de jeux vidéo et à toute personne qui crée des vidéos courtes où le sujet doit rester reconnaissable.
Utilisez ce workflow lorsque le text-to-video vous donne la bonne scène, mais le mauvais sujet. Utilisez-le lorsqu’une campagne a besoin du même produit héros dans plusieurs clips. Utilisez-le lorsqu’un personnage doit apparaître dans une ouverture, un gros plan, un plan d’action et une image de CTA sans devenir une autre personne. Utilisez-le lorsque vous avez besoin d’un système visuel, pas d’une seule génération chanceuse.
Réponse rapide : qu’est-ce qu’un workflow de référence d’image Veo 3 ?
Un workflow de référence d’image Veo 3 commence par une image fixe qui définit le sujet, puis utilise des prompts pour générer du mouvement tout en préservant ce sujet. L’image de référence peut être une photo produit, une fiche personnage, une mascotte de marque, un design d’emballage, un écran d’application, un lieu ou une image de storyboard validée. Le prompt doit décrire le mouvement, la caméra, l’éclairage et l’environnement, mais il doit aussi indiquer à Veo 3 de préserver les marqueurs d’identité importants.
Un workflow simple ressemble à ceci :
- Choisissez une image de référence de haute qualité.
- Identifiez les détails visuels qui ne doivent pas changer.
- Écrivez un prompt de mouvement autour de ces détails fixes.
- Générez de courts clips contrôlés.
- Rejetez les sorties où l’identité du sujet dérive.
- Utilisez le meilleur clip comme élément de base pour une séquence.
- Répétez avec des prompts similaires pour les autres plans.
Pour les fondamentaux plus larges des prompts, lisez exemples de prompts Veo 3. Pour le contexte des workflows gratuits, consultez limites de Google AI Studio Veo 3. Pour une comparaison avec d’autres modèles, consultez Veo 3 vs Runway Gen-4.5.
Pourquoi la cohérence compte plus qu’un seul beau clip
Les démos vidéo d’IA récompensent souvent le plan unique le plus surprenant. La production récompense la répétabilité. Si vous créez un clip expérimental, une légère dérive du sujet peut être acceptable. Si vous créez des publicités produit, des teasers de lancement, des vidéos de fondateur, des bandes-annonces de jeux, des intros de cours ou du contenu social de marque, la cohérence devient la différence entre un résultat utilisable et inutilisable.
Un spectateur n’analyse peut-être pas consciemment chaque détail, mais il remarque quand un produit change de forme, quand le visage d’un personnage paraît différent ou quand une couleur de marque varie d’un plan à l’autre. Cette incohérence affaiblit la confiance. En paid social, elle peut rendre une publicité moins crédible. En ecommerce, elle peut donner une représentation incorrecte du produit. Dans le storytelling, elle rompt la continuité. Dans l’éducation, elle détourne l’attention de la leçon.
La valeur de l’image de référence, c’est le contrôle. Elle donne au modèle une cible visuelle. Elle donne aussi à votre équipe un standard d’évaluation. Au lieu de débattre pour savoir si un clip « est beau », vous pouvez demander s’il préserve la référence approuvée. Le logo reste-t-il lisible ? Le personnage conserve-t-il les mêmes cheveux, vêtements et silhouette ? Le produit ressemble-t-il toujours au SKU réel ? L’écran de l’application conserve-t-il la mise en page principale ? Si la réponse est non, rejetez le clip, même si le mouvement est attrayant.
Préparer l’image de référence
L’image de référence doit être nette, bien éclairée et sans ambiguïté. Si l’image contient trop de sujets, le modèle peut ne pas savoir quoi préserver. Si le produit est minuscule, l’identité dérivera. Si le personnage est masqué par des ombres dramatiques, la vidéo générée peut inventer les détails manquants. Une bonne image de référence n’a pas besoin d’être sophistiquée, mais elle doit communiquer clairement le sujet.
Utilisez cette checklist avant l’import :
| Vérification de la référence | Ce qu’il faut rechercher | Pourquoi c’est important |
|---|---|---|
| Taille du sujet | Le sujet principal est suffisamment grand | Les petits sujets dérivent plus vite |
| Arrière-plan propre | L’arrière-plan ne crée pas de concurrence visuelle | Le modèle peut identifier le sujet |
| Caractéristiques lisibles | Le visage, le logo, l’emballage ou la forme est visible | Les marqueurs d’identité sont préservés |
| Éclairage stable | Pas d’ombres extrêmes sur les détails clés | Moins de caractéristiques inventées |
| Ratio d’aspect correct | Correspond au format vidéo cible | Moins de risque de recadrage |
| Version conforme à la marque | Produit, couleurs et design approuvés | Réduit les cycles de révision |
Pour les personnages, utilisez un portrait net ou une fiche de personnage. Pour les produits, utilisez une photo produit de face, plus un second angle si votre workflow le permet. Pour les écrans d’application, utilisez un écran simplifié qui montre la mise en page principale sans minuscules mentions légales. Pour les lieux, utilisez une image large qui définit clairement l’environnement.
Identifier les détails non négociables
Avant d’écrire le prompt, listez les détails qui doivent rester stables. C’est l’étape la plus importante, car « rends-le cohérent » est trop vague. Veo 3 a besoin d’instructions de préservation concrètes.
Pour un personnage, les éléments non négociables peuvent inclure la couleur des cheveux, la veste, la tranche d’âge, la forme du visage, les lunettes, les chaussures et la silhouette générale. Pour un produit, ils peuvent inclure la forme de l’emballage, la couleur de l’étiquette, la position du logo, le matériau, la couleur du bouchon, la taille et l’angle héro. Pour une mascotte, ils peuvent inclure les proportions, les yeux, la texture, la palette et l’expression. Pour un lieu, ils peuvent inclure l’heure de la journée, l’architecture, le mobilier, la signalétique et la température de couleur.
Transformez ces détails en une clause de prompt :
Préserve la forme exacte du produit, le corps blanc de la bouteille, le bouchon bleu, la position de l’étiquette frontale, le logo minimal et l’éclairage studio propre de l’image de référence.
ou :
Conserve la même identité de personnage : cheveux noirs courts, lunettes rondes, bomber vert, silhouette fine, expression calme et style animé chaleureux.
Cette clause doit apparaître avant la description du mouvement. La préservation vient en premier, car elle définit les limites du plan.

Formule de prompt pour référence d’image
Utilisez cette formule de prompt :
En utilisant l’image de référence comme ancre d’identité, crée une vidéo [durée/style/format] de [sujet] en train de [action]. Préserve [détails non négociables]. Ajoute [mouvement de caméra], [éclairage], [environnement] et [ambiance]. Ne modifie pas [logos/texte/visage/forme du produit]. Garde le sujet reconnaissable tout au long du clip.
Exemple pour un produit :
En utilisant l’image de référence comme ancre d’identité, crée une vidéo produit verticale de cinq secondes montrant la bouteille de soin posée sur un comptoir de salle de bain propre. Préserve le corps blanc de la bouteille, le bouchon bleu, le placement de l’étiquette frontale, les épaules arrondies et le style premium minimal. Ajoute un lent mouvement de rapprochement, une douce lumière du matin, un léger reflet d’eau et une ambiance spa épurée. Ne modifie pas le logo, l’étiquette, la forme de la bouteille ni la couleur du bouchon.
Exemple pour un personnage :
En utilisant l’image de référence comme ancre d’identité, crée un plan cinématographique de six secondes du même personnage marchant dans un espace de travail lumineux en studio. Préserve les cheveux noirs courts, les lunettes rondes, le bomber vert, la structure du visage et l’expression calme et confiante. Ajoute un travelling fluide, une lumière naturelle douce, une faible profondeur de champ et un mouvement naturel. Ne modifie pas l’identité ni les vêtements du personnage.
Exemple pour un écran d’application :
En utilisant l’image de référence comme ancre visuelle, crée un plan de démonstration produit de quatre secondes du même tableau de bord d’application sur une tablette. Préserve la mise en page du tableau de bord, les boutons bleus principaux, les cartes de graphiques et l’interface blanche épurée. Ajoute une légère inclinaison de caméra, un reflet doux et un mouvement de doigt en survol. N’invente pas de nouveau texte d’interface et ne modifie pas la mise en page.
Construire une séquence sans perdre la continuité
Le plus difficile n’est pas de générer un seul clip. C’est de générer plusieurs clips qui semblent appartenir au même ensemble. Pour une séquence produit, commencez par un plan héros, puis créez des plans rapprochés, d’utilisation, d’environnement et de CTA. Pour une séquence avec personnage, commencez par un plan moyen, puis créez des plans de réaction, d’action, de détail et de fin. Gardez la même référence et la même clause de préservation dans chaque prompt.
Une séquence produit pourrait ressembler à ceci :
- Produit héros sur fond épuré.
- Produit soulevé par un mouvement de main doux.
- Gros plan sur une texture ou une fonctionnalité.
- Environnement lifestyle avec le même produit.
- Packshot final avec CTA.
Une séquence avec personnage pourrait ressembler à ceci :
- Le personnage entre dans la scène.
- Le personnage regarde un écran.
- Le personnage réagit à un résultat.
- Le personnage traverse l’environnement.
- Le personnage apparaît dans la carte de titre finale.
Ne changez pas trop de variables entre les plans. Si le premier plan utilise une lumière de studio chaleureuse et que le deuxième utilise une lumière néon nocturne, la continuité devient plus difficile. Si le style de caméra passe d’un documentaire à main levée à une publicité brillante, la séquence peut sembler assemblée artificiellement. Gardez une bible de style commune : éclairage, rendu de l’objectif, étalonnage des couleurs, mouvement, description du sujet et environnement.
Workflow de cohérence produit
Les vidéos produit ne pardonnent pas, car l’objet représente quelque chose de réel. Un produit généré qui semble presque correct peut quand même être faux. Utilisez des images de référence lorsque vous avez besoin d’une précision d’emballage, d’une cohérence des couleurs, d’une continuité des matériaux ou d’une échelle produit fiable.
Commencez par un packshot propre. Si le produit possède un logo ou une étiquette riche en texte, ne vous attendez pas à un texte parfait dans chaque image. Utilisez le clip généré comme matériau de mouvement et superposez le texte officiel au montage si nécessaire. Pour les publicités ecommerce, la forme, la couleur et la reconnaissabilité du produit comptent davantage que le fait de demander au modèle de reproduire chaque minuscule ligne d’étiquette.
Clauses recommandées pour les prompts produit :
- « préserver la silhouette exacte et les proportions de l’emballage »
- « ne pas modifier la disposition de l’étiquette »
- « la zone du logo reste stable et orientée vers l’avant »
- « le produit reste centré et reconnaissable »
- « aucun parfum, argument, badge ou étiquette supplémentaire inventé »
- « le mouvement de caméra est suffisamment subtil pour garder l’emballage lisible »
Pour les gros plans produit, demandez un mouvement de matière plutôt qu’un changement d’identité. Exemples : condensation sur une canette, ombre douce sous une bouteille, lumière se reflétant sur une arête métallique, particules de poussière dans un faisceau de studio, produit tournant légèrement sans changer de forme.
Workflow de cohérence des personnages
Les personnages ont besoin d’une protection de leur identité : visage, corps, cheveux, vêtements et style. Si vous créez un avatar de créateur, une mascotte de marque, un personnage de jeu ou un animateur pédagogique, commencez par une image de référence solide. Une fiche de personnage avec vues de face et de côté est préférable à une capture d’écran informelle, mais même un portrait propre vaut mieux qu’un prompt uniquement textuel.
Utilisez des descriptions stables d’un prompt à l’autre. Ne décrivez pas le personnage différemment d’un plan à l’autre. Si le personnage porte une veste verte dans le premier plan, ne dites pas « veste bleue » dans le deuxième. Si le style est animé en 3D, ne passez pas au photoréalisme sauf si vous voulez intentionnellement une nouvelle version.
Lorsque vous examinez les résultats, comparez-les côte à côte avec la référence. Regardez d’abord le visage, puis la silhouette, puis les vêtements, puis le style. Rejetez les clips où le sujet devient une personne similaire mais différente. Un beau clip avec le mauvais personnage n’est pas un bon clip.
Erreurs à éviter avec les images de référence
La première erreur consiste à téléverser un collage trop chargé. Le modèle peut animer le mauvais objet. La deuxième erreur consiste à s’appuyer sur du texte minuscule. Les petites typographies peuvent changer pendant la génération. La troisième erreur consiste à demander une grande transformation alors que vous avez besoin de cohérence. Si vous dites « transformez ce produit en version futuriste », le modèle peut obéir et modifier le produit. La quatrième erreur consiste à changer l’éclairage et l’environnement de façon trop agressive entre les plans.
La cinquième erreur consiste à ne pas documenter le prompt gagnant. Lorsqu’un clip fonctionne, enregistrez le prompt, l’image de référence, le seed ou les paramètres si disponibles, la durée, le format d’image et les notes de révision. La cohérence s’améliore lorsque le workflow devient reproductible.
Checklist de révision
Utilisez cette checklist avant publication :
- Le sujet correspond toujours à l’image de référence.
- La forme du produit, ses couleurs et ses détails clés restent stables.
- Le visage, les vêtements et la silhouette du personnage restent reconnaissables.
- Aucune fausse affirmation, étiquette inventée ou fonctionnalité produit trompeuse n’apparaît.
- Le mouvement de caméra améliore le plan sans masquer les détails.
- Le clip correspond au format d’image prévu.
- Les plans de la séquence partagent le même éclairage, le même étalonnage et le même style.
- Le montage final inclut des sous-titres ou overlays officiels lorsque le texte exact est important.
FAQ
Qu’est-ce qu’un workflow d’image de référence Veo 3 ?
C’est un processus dans lequel une image fixe sert d’ancrage à l’identité d’un personnage, d’un produit, d’un lieu ou d’un asset de marque, tandis que Veo 3 génère le mouvement autour de cette image.
Une image de référence peut-elle garder un produit parfaitement exact ?
Elle améliore la cohérence, mais vous devez tout de même vérifier attentivement la forme du produit, l’étiquette, le logo et les affirmations. Ajoutez en overlay le texte juridique ou produit exact lors du montage lorsque la précision est importante.
Quelles images fonctionnent le mieux comme références ?
Les images nettes, en haute résolution, avec un sujet clairement identifiable, un éclairage stable et des détails d’identité visibles fonctionnent le mieux. Évitez les collages encombrés et les textes minuscules.
Comment conserver le même personnage d’un plan à l’autre ?
Réutilisez la même image de référence et la même clause de préservation dans chaque prompt. Gardez les vêtements, l’éclairage, le style et le langage caméra cohérents.
Dois-je utiliser text-to-video ou image-to-video ?
Utilisez text-to-video pour inventer largement une scène. Utilisez image-to-video ou une image de référence lorsque l’identité du sujet, l’exactitude du produit ou la continuité de marque sont importantes.
Combien de clips dois-je générer ?
Pour les projets importants, générez au moins trois variations par plan et rejetez toute sortie où l’identité du sujet dérive.
Conclusion finale
La référence d’image Veo 3 n’est pas seulement une fonctionnalité pratique. C’est un workflow de production pour garantir la cohérence. Commencez avec une référence solide, définissez les détails d’identité non négociables, rédigez des prompts axés d’abord sur la préservation, générez de courts clips contrôlés, puis comparez les sorties à l’image originale. Ce processus vous aide à transformer la vidéo IA, au-delà de simples expérimentations ponctuelles, en séquences exploitables pour des personnages, des produits et des marques.
Workflow avancé : créer un pack de références
Pour les projets importants, ne vous reposez pas sur une seule image informelle. Créez un petit pack de références avant de générer. Un pack de références est un dossier d’ancres visuelles validées qui définissent le sujet sous plusieurs angles utiles. Il peut inclure une vue de face du produit, une vue de côté, une photo lifestyle, une référence couleur, un gros plan de l’emballage et un arrière-plan de marque final. Pour les personnages, il peut inclure une vue de face, une vue mi-corps, une référence d’expression, une référence vestimentaire et une image d’environnement.
Le pack de références n’a pas besoin d’être compliqué. Son rôle est de réduire l’ambiguïté. Lorsque l’équipe s’accorde sur le pack, la personne qui rédige les prompts sait quels détails doivent être protégés, et la personne chargée de la review sait à quoi comparer le résultat. C’est particulièrement utile pour les agences, car cela évite les retours client du type : « le clip est réussi, mais ce n’est pas notre produit ». Le standard d’approbation existe avant même le début de la génération.
Lorsque vous utilisez un pack de références, choisissez l’image principale pour chaque plan. N’importez pas et ne référencez pas toutes les images si l’outil n’a besoin que d’une seule ancre. Utilisez l’image produit de face pour les packshots, l’image lifestyle pour les scènes contextuelles et le gros plan pour les plans de fonctionnalités. Gardez des noms de fichiers descriptifs : hero-product-front, hero-product-side, founder-avatar-green-jacket, mascot-approved-expression ou dashboard-clean-layout. Cela rend le workflow plus facile à répéter.
Matrice de plans pour des campagnes cohérentes
Une matrice de plans vous aide à planifier un ensemble de vidéos sans perdre la continuité. Au lieu de générer des clips aléatoires, définissez l’objectif de chaque plan et la règle de préservation associée.
| Plan | Objectif | Priorité de référence | Idée de mouvement | Point de contrôle |
|---|---|---|---|---|
| Packshot héro | Présenter le produit | Forme du produit et étiquette | Lent travelling avant | Étiquette, couleur, silhouette |
| Usage lifestyle | Montrer le contexte | Échelle et couleur du produit | Interaction avec la main | Le produit reste la même référence SKU |
| Gros plan fonctionnalité | Expliquer le bénéfice | Matière et détail | Balayage lumineux macro | Aucune allégation inventée |
| Réaction du personnage | Ajouter de l’émotion | Visage et vêtements | Plan de suivi moyen | Même personne, même tenue |
| Image CTA | Conclure clairement | Produit + palette de marque | Plan fixe maintenu | Image finale lisible |
Cette matrice est utile parce qu’elle sépare l’ambition créative du contrôle qualité. Chaque plan a une raison d’être. Chaque plan a aussi une règle de rejet. Si le plan lifestyle est magnifique mais que le produit prend la mauvaise couleur, il échoue. Si le plan héro est exact mais ennuyeux, générez une nouvelle variation de mouvement. Cela accélère la production, car les retours deviennent spécifiques.
Conseils de montage après la génération
Même un clip Veo 3 réussi nécessite généralement du montage. Utilisez le résultat généré comme une base de mouvement. Coupez les débuts et fins faibles. Stabilisez le rythme avec des sous-titres, des overlays produit, de la musique ou une voix off. Si le texte exact de l’étiquette produit est important, superposez le texte officiel ou montrez une image fixe vérifiée du produit après le mouvement généré. Si l’identité du personnage est importante, coupez avant que le visage ne commence à dériver.
Pour les séquences multi-plans, harmonisez la couleur et le contraste au montage. Des clips AI générés à partir de la même référence peuvent tout de même varier en luminosité, saturation ou rendu d’objectif. Un étalonnage simple peut rendre la séquence plus cohérente. Ajoutez le même style de sous-titres et le même traitement CTA sur tous les clips. La cohérence n’est pas seulement générée ; elle se construit aussi au montage.
Mesure : ce qu’il faut suivre
Si vous utilisez une image de référence pour le marketing, suivez les résultats pratiques. Mesurez combien de clips générés étaient utilisables, combien ont été rejetés pour dérive d’identité, quelles clauses de prompt ont amélioré la cohérence et quelles images de référence ont le mieux fonctionné. Avec le temps, cela devient un dataset de production pour votre équipe.
Les champs de suivi utiles incluent : nom de l’image de référence, version du prompt, type de sujet, format d’image, durée du clip, accepté ou rejeté, raison du rejet, plateforme finale et note de performance. Cela transforme la vidéo AI d’un jeu de devinettes créatif en workflow reproductible. L’objectif n’est pas seulement de créer une meilleure vidéo ; il est d’apprendre quels schémas de référence et de prompt protègent de manière fiable vos assets de marque.

Related Articles
Continue with more blog posts in the same locale.

Générateur de vidéos d’aperçu d’app avec Veo 3 2026 : créez des clips pour l’App Store et vos produits
Un workflow pratique de générateur de vidéos d’aperçu d’app avec Veo 3 pour les clips App Store, vidéos de lancement produit, promotions d’app mobile, captures d’écran, prompts et contrôles QA.
Read article
Workflow de storyboard long format Veo 3 2026 : prompts multi-plans qui préservent la continuité
Un workflow pratique de storyboard long format Veo 3 pour créer des vidéos IA multi-plans avec continuité, prompts réutilisables, cartes de scènes, contrôles de plans et structure prête au montage.
Read article
Seedance 2.0 Free vs Veo 3 Free 2026 : accès, qualité et limites
Une comparaison pratique 2026 de Seedance 2.0 Free et Veo 3 Free : accès, qualité des rendus, limites, workflows et quand choisir chaque option vidéo IA gratuite.
Read article