Генератор JSON-промптов Veo 3: руководство по структурным промптам и шаблоны (2026)

Хватит надеяться на хороший результат Veo 3 — проектируйте его. Полное руководство 2026 по JSON-промптингу: анатомия полей, 4 готовых шаблона, image-to-video и приём для согласованности кадров.

E

Emma Chen · 10 min read · Jun 25, 2026

Генератор JSON-промптов Veo 3: руководство по структурным промптам и шаблоны (2026)

Большинство людей вводят в Veo 3 одно предложение, скрещивают пальцы и надеются, что модель угадает, что они имели в виду. Иногда получается отлично. Но чаще камера уезжает не туда, освещение меняется от кадра к кадру, у персонажа вдруг меняется цвет куртки, а звук совсем не такой, как вы себе представляли. Решение, к которому пришли продвинутые авторы в 2026 году, — это не более длинное предложение, а JSON-промпт. Вместо одного сплошного абзаца вы передаёте Veo 3 структурированный объект, в котором каждый параметр назван отдельно: субъект, действие, камера, объектив, освещение, цвет, звук и стиль. Модель перестаёт угадывать и начинает выполнять инструкции.

Это руководство — полный справочник по JSON-промптингу в Veo 3, который можно копировать и использовать сразу. Вы узнаете, что такое JSON-промпт на самом деле, почему структурированный формат даёт более стабильные результаты, чем обычный текст, разберёте полную анатомию объекта-промпта Veo 3 поле за полем и получите четыре готовых шаблона, которые можно вставить прямо в Veo 3 уже сегодня. Если вы всё ещё пишете промпты абзацами, именно этот апгрейд сильнее всего повысит вашу долю удачных кадров. Совсем новичок в промптинге? Сначала пробегитесь по нашему руководству по промпт-инжинирингу Veo 3, а затем возвращайтесь сюда, чтобы перейти на структурированные промпты.

Что такое JSON-промпт?

JSON (JavaScript Object Notation) — это простой и читаемый способ записывать структурированные данные в виде пар «ключ — значение». JSON-промпт для Veo 3 берёт ту же идею, которую вы обычно впихиваете в одно предложение, и разбивает её на именованные поля:

{
  "shot": "medium close-up",
  "subject": "a barista with curly red hair and a green apron",
  "action": "steams milk, then looks up and smiles at the camera",
  "setting": "a sunlit specialty coffee shop, morning",
  "camera": "slow push-in on a 50mm lens, shallow depth of field",
  "lighting": "warm window light from the left, soft shadows",
  "audio": "hiss of the steam wand, low cafe chatter, no music",
  "style": "photorealistic, cinematic, 35mm film grain"
}

Сравните это с вариантом-абзацем: «Бариста с рыжими кудрявыми волосами в зелёном фартуке взбивает молоко в залитой солнцем кофейне, затем поднимает взгляд и улыбается, снято на объектив 50 мм с медленным наездом и тёплым светом из окна, со звуком парового сопла и гулом кофейни». Оба описывают одну и ту же сцену. Но в JSON-версии каждая инструкция отделена, так что модель не сольёт «тёплый свет из окна слева» с описанием субъекта и не забудет про звуковую подсказку, спрятанную в конце длинного предложения. Каждый ключ — это чистый канал намерения.

Veo 3 не требует формальной схемы — модель читает естественно-языковые значения внутри объекта, — но сам акт структурирования заставляет вас чётко проговаривать то, что вы иначе оставили бы расплывчатым. Именно из этой чёткости и рождается скачок качества.

Почему JSON-промпты работают в Veo 3 лучше

Три конкретные причины, по которым структурированные промпты превосходят абзацы, особенно на такой модели, как Veo 3, которая генерирует и картинку, и нативный звук за один проход:

1. Ничего не теряется. В длинном предложении модель сильнее всего учитывает слова, которые видит первыми и последними. Звуковые подсказки, выбор объектива и цветокоррекция, засунутые в середину абзаца, регулярно игнорируются. В JSON каждая инструкция находится в собственном поле с равным весом, поэтому ваши ключи audio и lighting получают столько же внимания, сколько и субъект.

2. Согласованность между кадрами. Это самое важное. Если вы держите поля subject, style и lighting идентичными в нескольких генерациях и меняете только action и camera, вы получаете узнаваемо одинакового персонажа и единый вид от кадра к кадру. Это основа для сшивания кадров в более длинную последовательность — смотрите наш разбор о том, как продлить Veo 3 за пределы 8 секунд, где именно стабильные JSON-блоки не дают персонажу «поплыть» на полпути.

3. Повторяемость и итерации. Поскольку промпт структурирован, вы можете менять по одной переменной за раз и реально понимать, за что отвечает каждое поле. Поднимите lighting с «тёплого» до «высокоключевого» и перезапустите. Смените camera со «статичной» на «медленный наезд» и перезапустите. Вы выстраиваете контролируемую петлю обратной связи вместо переписывания целого абзаца с гаданием, какое слово сдвинуло результат.

Анатомия JSON-промпта для Veo 3

Вот полный набор полей, который надёжно работает с Veo 3 в 2026 году. Вам не нужны все поля в каждом промпте — используйте то, что требует кадр, — но это полный список, сгруппированный по назначению.

Основная сцена

  • shot — кадрирование: extreme wide, wide, medium, medium close-up, close-up, macro.
  • subject — кто или что, с конкретными, устойчивыми визуальными деталями (волосы, одежда, возраст, телосложение). Повторяйте дословно ради согласованности.
  • action — что происходит, в хронологическом порядке. Используйте слова последовательности: «сначала… потом…».
  • setting — локация плюс время суток и погода.

Камера и объектив

Свет и цвет

  • lighting — направление, качество и источник: «мягкий ключевой справа, контровой сзади, практический неон».
  • color / color_grade — палитра и настроение: «бирюзовый и оранжевый», «приглушённый пастельный», «контрастный нуар».

Звук (суперсила Veo 3)

  • audio — описывайте весь микс: окружающий звук, звуковые эффекты и музыку по отдельности. Чётко указывайте, когда хотите тишину или отсутствие музыки.
  • dialogue — точная реплика в кавычках. Veo 3 сделает липсинк. Держите реплики короткими для 8-секундного кадра. Наше руководство по нативному звуку подробно раскрывает это поле.

Стиль и финиш

  • style — общая эстетика: photorealistic, cinematic, documentary, claymation, anime, 35mm film.
  • aspect_ratio16:9, 9:16 для вертикали, 1:1.
  • negative — чего избегать: «без текстовых надписей, без искажённых рук, без лишних пальцев». Подробнее — в руководстве по негативным промптам.

Четыре шаблона JSON для копирования

Это полноценные рабочие отправные точки. Вставьте один из них в Veo 3, а затем подмените значения под свою сцену.

1. Презентация продукта (e-commerce / реклама)

{
  "shot": "macro to medium pull-back",
  "subject": "a matte-black wireless earbud case on a wet slate surface",
  "action": "the lid slowly opens, the earbuds glow, then the camera pulls back to reveal the full product",
  "setting": "minimalist studio, dark background",
  "camera": "slow dolly-out on a 100mm macro lens, rack focus",
  "lighting": "single soft top light, subtle blue rim light",
  "color_grade": "high-contrast, cool blues and silver",
  "audio": "a soft mechanical click as the lid opens, a low ascending synth swell, no voiceover",
  "style": "premium commercial, photorealistic, glossy reflections",
  "aspect_ratio": "16:9",
  "negative": "no text, no logos, no hands"
}

2. Кинематографичный диалог (с липсинком)

{
  "shot": "medium close-up",
  "subject": "a weary detective in a damp trench coat, 50s, stubble",
  "action": "he leans against a brick wall, exhales, and speaks directly to camera",
  "setting": "a rain-soaked alley at night, neon signs reflecting in puddles",
  "camera": "slow handheld push-in on an 85mm lens, shallow depth of field",
  "lighting": "magenta and cyan neon practicals, hard rim light, deep shadows",
  "dialogue": "\"Everybody in this city is running from something. Tonight, it's my turn.\"",
  "audio": "steady rain, distant traffic, a low ominous drone, no music bed",
  "style": "neo-noir, cinematic, 35mm film grain",
  "aspect_ratio": "16:9"
}

3. Вертикальный ролик для соцсетей (TikTok / Reels)

{
  "shot": "medium",
  "subject": "an energetic fitness coach in bright activewear",
  "action": "demonstrates a kettlebell swing with perfect form, then points at the camera and gives a thumbs up",
  "setting": "a sunlit home gym with plants",
  "camera": "static tripod, eye level, then a quick snap zoom on the thumbs up",
  "lighting": "bright natural daylight, clean and high-key",
  "audio": "upbeat energetic background music, a rhythmic exhale on each swing",
  "dialogue": "\"Three sets of fifteen — let's go!\"",
  "style": "vibrant, modern, social-media polish",
  "aspect_ratio": "9:16",
  "negative": "no warped equipment, no extra limbs"
}

4. Кадр серии с согласованным персонажем

Зафиксируйте subject, style и lighting; между запусками меняйте только action и camera.

{
  "shot": "medium",
  "subject": "Mira, a young astronaut with a buzzcut and a scar over her left eyebrow, wearing a worn orange flight suit",
  "action": "checks a wrist console, frowns, then looks off-screen toward an alarm",
  "setting": "the cramped cockpit of a derelict spaceship, red emergency lighting",
  "camera": "slow orbit to the right on a 35mm lens",
  "lighting": "pulsing red emergency light, faint blue glow from the console",
  "audio": "low hum of failing systems, an intermittent alarm beep, tense ambient drone",
  "style": "sci-fi, cinematic, photorealistic, film grain",
  "aspect_ratio": "16:9"
}

JSON-промпты с референсным изображением (image-to-video)

Структурирование JSON работает не хуже и тогда, когда вы стартуете с изображения, а не с чистого текста. Когда вы загружаете референсный кадр, изображение уже фиксирует внешность субъекта, одежду и обстановку — поэтому можно убрать тяжёлое описание в subject и setting и потратить поля на движение и камеру. Изображение отвечает за «как это выглядит», а JSON — за «что оно делает».

{
  "input": "uploaded reference image of the character",
  "action": "the character turns their head toward the window, then breaks into a slow smile",
  "camera": "gentle handheld drift, slight push-in on a 50mm lens",
  "lighting": "match the soft window light in the reference image",
  "audio": "quiet room tone, a soft inhale, distant birdsong, no music",
  "style": "preserve the photographic style of the reference image",
  "negative": "do not change the character's face, hair, or clothing"
}

Обратите внимание, как lighting и style говорят match и preserve, а не переописывают сцену заново, — это удерживает Veo 3 на вашем изображении, а не заставляет его выдумывать заново. Поле negative, выполняющее работу по защите идентичности («не менять лицо»), — одна из самых мощных строк, которую можно написать для image-to-video. Полный процесс работы с референсным изображением — в нашем руководстве по image-to-video в Veo 3.

Продвинутое: порядок и группировка полей

Два приёма отличают приличные JSON-промпты от отличных. Во-первых, порядок полей — это мягкий сигнал: ставьте самую важную инструкцию ближе к началу. Если важнее всего идентичность персонажа, начинайте с subject; если героем кадра является движение камеры, начинайте с camera. Во-вторых, для сложных сцен можно группировать связанные значения во вложенные объекты, чтобы каждый кластер читался чисто:

{
  "subject": "a street violinist, late 20s, fingerless gloves",
  "action": "plays an energetic solo, eyes closed",
  "camera": { "movement": "slow arc left", "lens": "35mm", "depth_of_field": "shallow" },
  "lighting": { "key": "golden hour backlight", "fill": "soft bounce from the right" },
  "audio": { "music": "a fast, emotional solo violin", "ambient": "city street, faint applause", "sfx": "none" }
}

Veo 3 нормально читает вложенные значения, а группировка делает с первого взгляда понятным, что вы указали, а что оставили на усмотрение модели. Используйте плоские поля для простых кадров и вложенные объекты только тогда, когда в разделе действительно несколько подзначений, — избыточная вложенность простого промпта лишь добавляет шума.

Как использовать JSON-промпт в Veo 3

Особый режим не нужен. Veo 3 принимает JSON-объект напрямую в том же поле промпта, куда вы бы вписали предложение:

  1. Откройте Veo 3 на veo3ai.io (или Google Flow, если вам ближе вид раскадровки).
  2. Вставьте полный JSON-объект в поле промпта. Держите валидный JSON — парные скобки, значения в кавычках, запятые между полями.
  3. Задайте длину клипа и соотношение сторон, если интерфейс выводит их отдельно; иначе поле aspect_ratio внутри JSON сделает свою работу.
  4. Сгенерируйте, оцените, затем итерируйте, меняя по одному полю за раз.
  5. Чтобы выстроить последовательность, продублируйте JSON, держите subject/style/lighting замороженными и правьте только action и camera для следующего кадра.

Именно эта дисциплина замороженных блоков позволяет авторам удерживать персонажа «в образе» на протяжении многокадрового видео, что является предпосылкой для чего-либо длиннее одного клипа.

Генераторы JSON-промптов: нужны ли они?

В 2026 году появилась волна бесплатных инструментов-«генераторов JSON-промптов для Veo 3» — они дают форму с выпадающими списками для кадра, камеры и света, а затем экспортируют JSON за вас. Они удобны новичкам, которые не хотят вручную писать фигурные скобки, и для просмотра готовых библиотек промптов. Но как только вы освоите анатомию полей выше, писать JSON самому быстрее и гораздо гибче, чем кликать по чужой форме. Схема в этом руководстве и есть генератор — держите её открытой во вкладке, копируйте шаблон, наиболее близкий к вашему кадру, и правьте значения. Настоящий навык — не инструмент, а понимание того, какие поля за какие рычаги отвечают, и это у вас теперь есть.

Частые ошибки в JSON-промптинге

  • Невалидный JSON. Пропущенная запятая или непарная скобка могут заставить модель откатиться к чтению объекта как небрежного текста. Если сомневаетесь, вставьте объект в любой бесплатный валидатор JSON перед генерацией.
  • Перегруз одного поля. Не пишите абзац внутри action. Разносите разные идеи по правильным ключам — движение в camera, настроение в lighting и color_grade.
  • Забытый звук. Нативный звук Veo 3 — его главное преимущество перед старыми моделями. Пустое или отсутствующее поле audio растрачивает его. Всегда указывайте окружающий звук, эффекты и нужна ли музыка.
  • Слишком длинный диалог. В 8-секундный клип помещается примерно одна-две короткие фразы речи. Впихните монолог — и липсинк начнёт тараторить или оборвётся.
  • Изменение всего сразу. Когда результат близок, но не идеален, не переписывайте весь объект. Поменяйте одно поле, перезапустите, сделайте вывод.

JSON против обычного текста: что когда использовать

Текстовые промпты по-прежнему отлично подходят для быстрых, простых идей с одним кадром, где вам не важен точный контроль, — «золотистый ретривер бежит по пляжу на закате» будет смотреться хорошо в любом случае. Берите JSON, когда нужна точность (конкретный объектив, свет, цвет), согласованность (один и тот же персонаж или вид в нескольких клипах) или повторяемая итерация (изменение по одной переменной за раз). На практике: экспериментируйте свободно текстом, а затем фиксируйте удачную идею в JSON-объекте, чтобы её можно было воспроизводить и продлевать надёжно. За более широкой библиотекой текстовых идей для перевода в JSON загляните в наше руководство по лучшим промптам Veo 3.

Часто задаваемые вопросы

Поддерживает ли Veo 3 JSON-промпты официально? Veo 3 не навязывает формальную схему JSON, но надёжно разбирает структурированные JSON-объекты, потому что естественно-языковые значения внутри каждого поля — это именно то, что читает модель. Структура нужна для вашей пользы: она заставляет давать чёткие, разделённые инструкции, — и на практике даёт заметно более управляемые результаты, чем абзацы.

JSON-промптинг лучше детального предложения? Для сложных или повторяемых кадров — да. Формат не даёт инструкциям потеряться и сильно упрощает согласованность между клипами. Для разовой простой идеи хорошего предложения достаточно.

Какие поля важнее всего для согласованности? subject, style и lighting. Держите эти три идентичными между генерациями и меняйте только action и camera, чтобы персонаж и вид оставались «в образе» от кадра к кадру.

Можно ли использовать JSON-промпты для вертикальных видео TikTok и Reels? Да — задайте "aspect_ratio": "9:16" внутри объекта. Шаблон 3 выше — готовая вертикальная отправная точка.

Нужен ли мне генератор JSON-промптов? Нет. Шаблоны и список полей в этом руководстве покрывают то, что выдают генераторы. Править шаблон вручную быстрее и гибче, как только вы знаете поля.

Можно ли использовать JSON-промпты, стартуя с изображения? Да, и часто это самый чистый рабочий процесс. Пусть загруженное изображение задаёт внешность и обстановку, а вы используете поля JSON для action, camera и строки negative, защищающей идентичность персонажа. Смотрите шаблон image-to-video выше.

Какой длины может быть диалог в JSON-промпте? Держите реплики короткими — примерно одна-две короткие фразы для стандартного 8-секундного клипа. Более длинные реплики заставляют липсинк тараторить или обрываться. Если нужно больше диалога, разбейте его на несколько последовательных клипов с замороженным блоком subject.

Будет ли один и тот же JSON-промпт всегда давать одно и то же видео? Не совсем — Veo 3 всё равно вносит вариации между запусками. Но хорошо структурированный промпт резко сужает эту вариативность, а заморозка subject, style и lighting удерживает вид достаточно согласованным, чтобы сшивать клипы.

Начните промптить со структурой

JSON-промптинг — это разница между надеждой на хороший результат Veo 3 и его инженерным проектированием. Выберите шаблон, наиболее близкий к вашему кадру, вставьте его в Veo 3 и меняйте по одному полю за раз, пока всё не зазвучит. Когда вы свободно овладеете анатомией полей, вы больше никогда не вернётесь к борьбе со сплошными абзацами — а ваши персонажи, свет и звук наконец будут оставаться ровно там, где вы их поставили. Для следующего уровня сочетайте это с нашим руководством по кинематографичным промптам и начинайте строить многокадровые последовательности, которые действительно держатся вместе.

Ready to create AI videos?
Turn ideas and images into finished videos with the core Veo3 AI tools.

Related Articles

Continue with more blog posts in the same locale.

Browse all posts