- Blog
- Quelle est la durée des vidéos Veo 3.1 ? Limites de longueur (2026)
Quelle est la durée des vidéos Veo 3.1 ? Limites de longueur (2026)
Les clips Veo 3.1 plafonnent à 8 secondes par génération, mais l'extension permet d'atteindre ~148 secondes. Durées natives, Fast vs Quality, règles vidéo-à-vidéo et FAQ.
Emma Chen · 18 min read · Jun 29, 2026

Si vous préparez un plan dans Veo 3.1, la première chose à connaître est la limite de longueur de Veo 3.1 : une génération unique plafonne à 8 secondes. C'est le plafond strict pour un seul clip, que vous utilisiez Veo 3.1 standard ou Veo 3.1 Fast. Mais « 8 secondes par clip » n'est pas la même chose que « 8 secondes par vidéo » : avec le flux d'extension, vous pouvez enchaîner des clips en une seule vidéo continue allant jusqu'à environ 148 secondes (environ 2,5 minutes). Ce guide détaille exactement la durée possible des vidéos Veo 3.1 : les durées natives de clip, la longueur maximale atteignable par extension, la comparaison de durée entre Fast et Quality, et les règles vidéo-à-vidéo — pour que vous puissiez planifier votre découpage sans deviner.
Réponse courte : les limites de longueur de Veo 3.1 en un coup d'œil
Veo 3.1 génère des clips de 4, 6 ou 8 secondes par génération, 8 secondes étant le maximum pour un clip unique. En étendant un clip — ajout de 7 secondes par étape, jusqu'à 20 fois — vous pouvez construire une seule vidéo continue allant jusqu'à environ 148 secondes. La résolution est de 720p ou 1080p à 24 images par seconde.
| Spécification | Limite Veo 3.1 |
|---|---|
| Durées d'un clip unique | 4, 6 ou 8 secondes |
| Maximum d'une génération | 8 secondes |
| Longueur étendue maximale | ~148 secondes (8s + 7s × 20 extensions) |
| Gain par extension | 7 secondes |
| Nombre maximal d'extensions | 20 |
| Fréquence d'images | 24 ips |
| Résolution | 720p ou 1080p |
| Durée Fast vs Quality | Identique — les deux plafonnent à 8s |
Si vous ne retenez qu'une chose : 8 secondes est le mur par génération, ~148 secondes le plafond par vidéo. Tout ce qui suit explique comment travailler dans ces chiffres et quand chacun s'applique.
Quelle est la durée d'une seule vidéo Veo 3.1 ? (4, 6 ou 8 secondes)
Lorsque vous générez un clip directement — texte-à-vidéo ou image-à-vidéo — Veo 3.1 produit une sortie de longueur fixe. Vous pouvez demander 4, 6 ou 8 secondes, et 8 secondes est la plus longue durée qu'une génération unique renverra. Il n'y a pas de curseur pour 12 ou 15 secondes ; le modèle ne le propose pas, et aucune astuce de prompt ne débloque un clip unique plus long.
C'est parce que Veo 3.1 calcule chaque image plus l'audio natif en une seule passe cohérente. Maintenir stables le visage, la tenue, l'éclairage, la physique et le son synchronisé sur les lèvres d'un personnage devient exponentiellement plus difficile à mesure que la fenêtre s'allonge, donc Google fixe un plafond strict par génération pour protéger la qualité. La limite de 8 secondes est la fenêtre où Veo 3.1 rend bien de façon fiable, pas une astuce arbitraire de péage.
Quelques notes pratiques sur les durées natives :
- 8 secondes est la valeur par défaut et le maximum. La plupart des créateurs laissent 8s sauf raison précise de raccourcir.
- 4 et 6 secondes sont utiles pour un montage serré — flashs produit, habillages de logo, accroches sociales, ou tout temps fort qui n'a pas besoin d'une pleine tenue de 8 secondes.
- L'audio est généré sur toute la longueur du clip. Quelle que soit la durée choisie, Veo 3.1 sonorise dialogues, ambiance et effets sur toute la fenêtre.
- 24 ips est fixe. Un clip de 8 secondes fait environ 192 images ; cela compte si vous prévoyez d'interpoler ou de monter image par image plus tard.
Donc quand on demande « combien de temps durent les vidéos Veo 3.1 », la réponse honnête en une ligne est : chaque génération dure de 4 à 8 secondes, et le maximum est de 8 secondes par clip.
Longueur maximale de vidéo Veo 3.1 : comment atteindre ~148 secondes
C'est ici que la plupart des recherches sur la « longueur maximale de vidéo Veo 3.1 » se trompent — elles supposent que 8 secondes est la fin de l'histoire. Ce n'est pas le cas. Le flux d'extension vous permet de coudre de nouvelles générations à la fin d'un clip existant, et Veo 3.1 le prend en charge bien au-delà d'une seule étape.

Le calcul est simple :
- Vous commencez avec un clip de 8 secondes.
- Chaque extension ajoute 7 secondes de nouvelles images, amorcées depuis la fin du segment précédent.
- Vous pouvez étendre jusqu'à 20 fois.
- 8 + (7 × 20) = 148 secondes — environ 2,5 minutes de vidéo continue.
Ce chiffre de 148 secondes est le maximum pratique pour une seule vidéo continue Veo 3.1 construite via la boucle d'extension. La vidéo d'entrée que vous fournissez à un appel d'extension doit elle-même être générée par Veo et peut durer jusqu'à environ 141 secondes — c'est exactement ce qui permet à la dernière étape d'atteindre ~148s.
Une vidéo étendue en continu n'est pas la même chose que de couper entre des plans séparés dans un éditeur. L'extension garde le même plan en cours — même personnage, même décor, même éclairage — en utilisant la dernière image (et idéalement le mouvement et le style) du clip A comme amorce pour le clip B. Tout le savoir-faire de l'allongement consiste à contrôler la dérive entre segments pour que les coutures disparaissent.
Cet article est la référence des spécifications et des limites. Pour le flux d'extension pas à pas — le chemin de clics dans Flow Scene Builder, la technique d'enchaînement Frames-to-Video, la boucle d'extension via l'API Gemini, et les modèles de prompt prêts à copier qui empêchent votre personnage de changer à mi-parcours — suivez notre tutoriel dédié : Comment prolonger les vidéos Veo 3 au-delà de 8 secondes. Les limites ici disent ce qui est possible ; ce tutoriel montre exactement comment le faire. Vous pouvez ouvrir Veo 3.1 sur veo3ai.io dans un autre onglet et suivre.
Une mise en garde Flow à connaître
Dans Google Flow, le bouton Extend de base a historiquement fonctionné sur Veo 2 Fast — c'est-à-dire sans audio natif et avec une qualité inférieure à Veo 3.1. Si vous voulez étendre en conservant la pleine qualité Veo 3.1 et le son, la voie fiable est Frames-to-Video : enregistrez la dernière image de votre clip comme ressource, puis lancez la génération suivante à partir de cette image avec un modèle Veo 3.1 sélectionné. Cela préserve le rendu et l'audio que le bouton Extend en un clic abandonne. Le tutoriel d'extension ci-dessus couvre cela en détail.
Veo 3.1 Fast vs Quality : la durée change-t-elle ?
Une supposition courante est que Veo 3.1 Fast échange de la longueur contre de la vitesse. Ce n'est pas le cas. Veo 3.1 Fast et Veo 3.1 standard (Quality) prennent en charge exactement les mêmes durées : 4, 6 ou 8 secondes par clip, avec le même maximum de 8 secondes. La durée n'est pas la variable qui change entre les deux niveaux.

Ce qui diffère réellement, c'est la vitesse, le coût et une petite part de fidélité :
| Dimension | Veo 3.1 (Quality) | Veo 3.1 Fast |
|---|---|---|
| Durées de clip | 4 / 6 / 8 s | 4 / 6 / 8 s (identique) |
| Temps de rendu (clip 8s) | ~3–4 minutes | ~90–120 secondes |
| Coût approximatif | ~0,40–0,75 $ / seconde | ~0,10–0,15 $ / seconde |
| Qualité visuelle | Fidélité maximale | Différence minime (~1–8 %) |
| Audio natif | Oui | Oui |
Dans les comparaisons à l'aveugle, l'écart de qualité est faible — souvent dans la fourchette de 1 à 8 % selon la complexité de la scène, et la plupart des spectateurs ne distinguent pas Fast de Quality côte à côte de façon fiable. Le choix concerne donc rarement la longueur :
- Utilisez Veo 3.1 Fast pour les brouillons, l'itération de prompts, le contenu social et le travail à fort volume, où vitesse et coût comptent plus que les derniers pourcents de finition.
- Utilisez Veo 3.1 Quality pour les plans phares, les livrables clients, les mouvements complexes, ou tout ce où la fidélité vaut le temps de rendu et les crédits supplémentaires.
Quoi qu'il en soit, votre plafond par clip est de 8 secondes et votre plafond étendu de ~148 secondes. Le niveau ne déplace pas ces chiffres.
Règles de longueur vidéo-à-vidéo et d'extension de Veo 3.1
La « longueur vidéo-à-vidéo de Veo 3.1 » embrouille les gens car les règles d'entrée et de sortie diffèrent d'une génération neuve. Lorsque vous étendez ou exécutez une continuation vidéo-à-vidéo :
- La source doit être une vidéo générée par Veo. Vous ne pouvez pas injecter des images téléversées quelconques et les étendre ; le pipeline d'extension attend un clip produit par le modèle.
- La source peut durer jusqu'à ~141 secondes. Cette borne supérieure sur l'entrée est ce qui permet à l'extension finale d'atteindre le total de ~148 secondes.
- Chaque appel d'extension produit un gain de 7 secondes qui s'ajoute à votre vidéo existante, et non un clip autonome.
- La sortie étendue se calcule généralement en 720p. Si vous avez besoin d'une résolution maximale sur une pièce longue, prévoyez-le — plus vous allez loin via l'extension, plus vous travaillez dans la voie 720p plutôt que 1080p.
En pratique, cela signifie qu'une vidéo Veo 3.1 longue se construit de façon itérative : générez une base solide de 8 secondes, puis étendez par paliers de 7 secondes, en redéclarant la description du personnage et de la scène à chaque palier pour éviter la dérive. Le plafond est de 20 paliers / ~148 secondes, mais c'est généralement la discipline de qualité — et non la limite stricte — qui décide jusqu'où vous pouvez réellement aller avant l'apparition de coutures ou de dérive.
Pourquoi Veo 3.1 plafonne les clips à 8 secondes
Comprendre le pourquoi aide à mieux planifier vos plans. Veo 3.1 est un modèle génératif tout-en-un : il produit l'image, le mouvement, la physique et l'audio natif synchronisé ensemble en une seule passe. Trois choses rendent difficiles les générations uniques plus longues :
- La dérive d'identité. Plus le clip est long, plus un visage, une tenue ou un arrière-plan a de chances de muter subtilement. Une fenêtre de 8 secondes est l'endroit où le modèle tient l'identité de façon fiable.
- La cohérence de la physique et du mouvement. Un mouvement continu crédible sur plusieurs secondes cumule l'erreur. Les fenêtres courtes gardent le mouvement net.
- La synchronisation audio. La synchro labiale native et le design sonore doivent suivre l'image image par image ; les fenêtres plus longues augmentent le risque de désynchronisation.
Plutôt que de livrer des clips plus longs qui rendent moins bien, Google plafonne chaque génération à 8 secondes et propose l'extension comme voie vers la longueur. Il y a aussi un signal de feuille de route indiquant que les fenêtres de génération natives pourraient s'allonger (des rapports évoquent des durées plus longues par clip au cours de 2026), mais pour l'instant, 8 secondes par génération est le chiffre autour duquel planifier.
Comment choisir votre longueur Veo 3.1
Choisissez votre durée selon l'endroit où vivra la vidéo, pas selon « le plus long possible » :
- Accroche TikTok / Reels / Shorts : un seul clip de 8 secondes Veo 3.1 suffit souvent pour une accroche qui stoppe le défilement. Utilisez 4–6 secondes si le temps fort est un coup visuel rapide.
- Démo produit ou publicité : prévoyez 2 à 4 segments enchaînés (16–32 secondes) avec l'extension, en redéclarant le produit et l'éclairage à chaque palier.
- Explicatif ou court récit : construisez vers 30–60 secondes avec plusieurs extensions ou — souvent mieux — générez plusieurs plans distincts de 8 secondes et montez entre eux pour la variété.
- Plan continu maximal (~148s) : réservez cela aux cas qui ont vraiment besoin d'un plan ininterrompu. Plus vous poussez un seul plan continu, plus le contrôle de la dérive est difficile ; beaucoup de créateurs obtiennent un résultat plus fiable en combinant plusieurs segments continus plus courts en post-production.
Une règle utile : utilisez les clips natifs de 8 secondes comme brique de base, utilisez l'extension quand vous avez besoin de continuité, et utilisez un éditeur quand vous avez besoin de variété. La plupart des vidéos IA fortes ne sont pas un seul plan de 148 secondes — ce sont une séquence de plans de 8 secondes bien promptés.
Veo 3.1 vs Veo 3 sur la longueur : qu'est-ce qui a changé ?
Si vous avez déjà utilisé Veo 3, les règles de longueur se reportent presque sans changement. Veo 3 et Veo 3.1 génèrent tous deux des clips de 4, 6 ou 8 secondes avec un maximum de 8 secondes par génération, tous deux tournent à 24 ips, et tous deux atteignent les vidéos longues via le même mécanisme d'extension plutôt que par des générations uniques plus longues.
Ce que Veo 3.1 améliore se situe surtout à l'intérieur de cette fenêtre de 8 secondes et entre les extensions : une cohérence de personnage et de scène plus serrée, un meilleur mouvement et un audio natif plus solide — ce qui signifie en pratique que vos chaînes étendues dérivent moins et tiennent sur plus de paliers. Les chiffres de longueur en titre n'ont donc pas changé entre Veo 3 et Veo 3.1, mais la qualité que vous pouvez maintenir en approchant le plafond de ~148 secondes a changé. Pour une vue d'ensemble des limites de Veo et de l'accès gratuit, consultez notre guide des limites de Veo 3 dans Google AI Studio.
À retenir : ne vous attendez pas à ce que Veo 3.1 vous donne un clip unique de 20 secondes simplement parce que c'est une version plus récente. L'architecture privilégie toujours des générations courtes et de haute qualité cousues ensemble.
Planifier une vidéo Veo 3.1 attentive à la longueur (étape par étape)
Comme les limites sont fixes, le geste le plus malin est de planifier votre découpage autour de blocs de 8 secondes avant de générer quoi que ce soit. Voici un flux attentif à la longueur :
- Storyboardez par temps forts de 8 secondes. Découpez votre idée en temps forts individuels tenant chacun en 8 secondes. Une publicité de 32 secondes devient quatre temps forts ; un explicatif de 60 secondes environ huit. Cela impose un rythme net plutôt qu'un seul plan décousu.
- Décidez : continu ou coupe. Pour chaque transition, demandez si la caméra doit continuer à tourner (utilisez l'extension) ou sauter à un nouveau plan (générez un clip séparé et montez dans un éditeur). La continuité coûte un risque de dérive ; la coupe coûte la continuité mais achète variété et souplesse de résolution.
- Générez le clip de base à 8 secondes. Démarrez fort — le personnage, l'éclairage et le cadrage de votre premier clip deviennent l'amorce de tout ce que vous en étendez. Utilisez ici Veo 3.1 Quality s'il s'agit d'un plan phare.
- Étendez par paliers de 7 secondes en tout redéclarant. À chaque extension, répétez la description du personnage, la tenue, l'arrière-plan, l'éclairage et les indices audio. C'est le facteur le plus déterminant pour qu'une longue vidéo Veo 3.1 tienne ensemble. Surveillez la dérive du teint de peau ou de la garde-robe après quelques paliers.
- Terminez tôt les plans continus quand la dérive apparaît. Vous pouvez aller jusqu'à 20 paliers, mais si le rendu commence à se décaler au palier 6 ou 7, arrêtez la chaîne continue là et commencez un nouveau plan. La limite stricte est de 148 secondes ; la limite pratique est là où la qualité tient.
- Assemblez dans un éditeur. Combinez vos chaînes continues et vos clips autonomes, ajoutez des transitions et exportez. La plupart des vidéos Veo 3.1 soignées sont une séquence de plans courts solides, pas un seul plan maximal de 148 secondes.
Cette approche respecte le plafond de génération de 8 secondes et le plafond d'extension de ~148 secondes tout en contournant les problèmes de dérive qui viennent d'une poursuite aveugle de la longueur maximale. Les modèles de prompt détaillés pour les étapes 3–4 se trouvent dans le tutoriel d'extension.
FAQ : limites de longueur de Veo 3.1
Quelle peut être la durée des vidéos Veo 3.1 ? Une génération unique Veo 3.1 dure 4, 6 ou 8 secondes, 8 secondes étant le maximum par clip. En étendant — ajout de 7 secondes par palier, jusqu'à 20 fois — vous pouvez atteindre une vidéo continue d'environ 148 secondes (environ 2,5 minutes).
Quelle est la longueur maximale de vidéo dans Veo 3.1 ? Environ 148 secondes pour une seule vidéo continue, atteinte en étendant 20 fois une base de 8 secondes par 7 secondes chacune (8 + 7 × 20 = 148). Pour une génération unique non étendue, le maximum est de 8 secondes.
Pourquoi Veo 3.1 est-il limité à 8 secondes ? Veo 3.1 calcule image, mouvement et audio natif ensemble en une seule passe. Maintenir stables l'identité du personnage, la physique et la synchro labiale devient exponentiellement plus difficile sur une fenêtre plus longue, donc Google plafonne chaque génération à 8 secondes et propose l'extension pour des vidéos plus longues.
Veo 3.1 Fast a-t-il une limite de longueur plus courte que Quality ? Non. Veo 3.1 Fast prend en charge les mêmes durées de 4, 6 et 8 secondes que Veo 3.1 standard. Fast est environ deux fois plus rapide et environ cinq fois moins cher, avec seulement une différence de qualité minime (~1–8 %). La durée ne change pas entre les deux.
Combien de fois peut-on étendre une vidéo Veo 3.1 ? Jusqu'à 20 fois. Chaque extension ajoute 7 secondes, donc 20 extensions sur une base de 8 secondes atteignent le maximum de ~148 secondes.
Quelle longueur d'entrée le vidéo-à-vidéo de Veo 3.1 accepte-t-il ? La source doit être une vidéo générée par Veo et peut durer jusqu'à environ 141 secondes, ce qui permet à l'extension finale de 7 secondes d'atteindre le total de ~148 secondes. La sortie étendue se calcule généralement en 720p.
Puis-je générer directement une vidéo Veo 3.1 de 30 secondes ? Pas en une seule génération — le plafond par clip est de 8 secondes. Pour atteindre 30 secondes, vous étendez soit une base de 8 secondes par paliers de 7 secondes (environ quatre paliers), soit vous générez plusieurs clips et les montez ensemble.
Quelle résolution et fréquence d'images Veo 3.1 produit-il ? Veo 3.1 génère en 720p ou 1080p à 24 ips. Notez que les vidéos étendues (longues) se calculent généralement en 720p, donc si vous avez besoin de 1080p, gardez les clips courts ou planifiez votre montage en conséquence.
La limite de longueur de Veo 3.1 diffère-t-elle entre Flow et l'API Gemini ? Les chiffres clés sont les mêmes — 8 secondes par génération, 7 secondes par extension, jusqu'à ~148 secondes au total. La différence est l'interface : le bouton Extend en un clic de Flow utilisait historiquement Veo 2 Fast (sans audio), donc pour la pleine qualité Veo 3.1, utilisez Frames-to-Video dans Flow ou le point de terminaison d'extension de l'API Gemini.
Veo 3.1 prendra-t-il un jour en charge des clips uniques plus longs ? Les signaux de la feuille de route de Google pointent vers des fenêtres de génération natives plus longues au cours de 2026, mais pour l'instant le maximum par génération est fermement de 8 secondes. Planifiez autour de ce chiffre plutôt que d'attendre une future mise à jour.
Conclusion
La limite de longueur de Veo 3.1 se résume à deux chiffres : 8 secondes pour toute génération unique, et environ 148 secondes pour une seule vidéo continue construite avec le flux d'extension. Veo 3.1 Fast et Quality partagent exactement ces limites — Fast ne change que la vitesse et le coût, pas la durée. Planifiez votre projet autour de briques de 8 secondes, recourez à l'extension quand vous avez besoin d'un plan ininterrompu, et appuyez-vous sur un éditeur quand vous avez besoin de variété entre les plans. Quand vous serez prêt à vraiment franchir le mur des 8 secondes, suivez notre tutoriel d'extension pas à pas, et ouvrez Veo 3.1 pour commencer à générer votre premier clip.
Related Articles
Continue with more blog posts in the same locale.

Veo 3.1 Ingredients to Video : combiner plusieurs images de référence en un seul clip IA (2026)
Veo 3.1 ingredients to video : combinez jusqu'à trois images de référence — personnage, objet et scène — en un seul clip IA cohérent. Flux pas à pas, prompts et différences avec la référence unique et frames to video.
Read article
Prompts vidéo au ralenti pour Veo 3 (2026) : slow-motion cinématographique et rampes de vitesse
Maîtrisez le ralenti dans Veo 3 : vocabulaire de prompts, 7 prompts prêts à l'emploi, rampes de vitesse, gestion du son et erreurs à éviter.
Read article
Prompts vidéo POV pour Veo 3 : générer des plans à la première personne (2026)
Comment écrire des prompts POV pour Veo 3 pour une vidéo immersive à la première personne : formule en 5 parties, 12 exemples prêts à l'emploi, son synchronisé et workflow vertical pour TikTok et Shorts.
Read article