- 블로그
- Veo 3 POV 영상 프롬프트: 1인칭 시점 숏 만드는 법 (2026)
Veo 3 POV 영상 프롬프트: 1인칭 시점 숏 만드는 법 (2026)
Veo 3로 몰입감 있는 1인칭 POV 영상을 만드는 프롬프트 작성법: 5부 공식, 바로 쓰는 12가지 예시, 동기화 오디오 팁, 틱톡·쇼츠용 세로 워크플로.
Emma Chen · 13 min read · Jun 28, 2026


POV(point of view, 1인칭 시점) 영상은 지금 틱톡, 릴스, 유튜브 쇼츠에서 가장 중독성 강한 포맷 중 하나입니다. 시청자는 장면을 '바라보는' 것이 아니라 장면 그 자체가 '됩니다'. 문을 여는 것도, 칼을 쥐는 것도, 핸들을 잡는 것도, 모퉁이를 엿보는 것도 모두 시청자 자신입니다. '내가 이 순간 안에 있다'는 이 감각이 POV 콘텐츠를 스크롤을 멈추게 만드는 것이며, 바로 그것이 Veo 3가 다른 어떤 도구보다도 잘 구현하는 영역입니다.
Veo 3는 클립마다 네이티브로 동기화된 오디오를 동시에 생성하기 때문에, 1인칭 숏은 '보이는' 것만 몰입적인 것이 아니라 '들리는' 것도 몰입적입니다. 발소리가 닿고, 숨이 멎고, 빗방울이 보닛을 때리고, 목소리가 '당신' 귀 바로 옆에서 속삭입니다. 이 영상과 소리의 결합이 카메라처럼 느껴지는 클립과 '당신 자신'처럼 느껴지는 클립의 차이를 만듭니다.
이 가이드는 Veo 3용 POV 프롬프트 작성법을 구체적으로 설명합니다. 프롬프트 공식, 모델이 이해하는 카메라 용어, 인기 POV 장르별로 바로 쓸 수 있는 12개의 프롬프트 예시, 동기화 오디오를 입히는 법, 그리고 1인칭 환상을 무너뜨리는 실수를 바로잡는 법까지 다룹니다.
Veo 3에게 'POV'는 실제로 무엇을 의미하는가
영화 언어에서 POV 숏(point of view, 1인칭 시점)은 세상을 '캐릭터가 보는 그대로' 보여줍니다. 카메라가 누군가의 눈을 대신합니다. 그 인물 자체는 보이지 않고, 그 앞에 있는 것이 보이며, 흔히 그 손·팔·발이 프레임 안으로 들어옵니다.
Veo 3는 'POV shot'과 'first-person perspective'를 명시적인 카메라 지시로 인식합니다. 구글 자체의 프롬프팅 가이드와 모델이 학습한 영화 촬영 레퍼런스에 따르면, 숏 유형을 지정하는 것——클로즈업, 트래킹 숏, 오버 더 숄더, 항공 숏, 또는 POV——이 Veo가 장면을 어떻게 프레이밍할지 결정합니다. 'POV shot, first-person perspective'라고 쓰면 모델은 카메라를 눈높이로 낮추고, 중심인물을 시야에서 빼고, 손과 환경이 이야기를 이끌게 합니다.
이것이 중요한 이유는, 카메라를 묘사하지 않으면 Veo 3가 기본적으로 정지 또는 미세한 핸드헬드 움직임으로 가기 때문입니다. POV는 기본값이 아니라 명시적으로, 그것도 정확하게 요청해야 합니다. 좋은 소식은, 일단 공식을 이해하면 얼마든지 반복할 수 있다는 점입니다.
왜 Veo 3가 POV 콘텐츠에 적합한가
Veo 3의 몇 가지 핵심 기능은 1인칭 영상이 필요로 하는 것과 거의 완벽하게 들어맞습니다.
- 네이티브 동기화 오디오. Veo 3는 소리를 영상과 '함께' 생성합니다——환경음, 발소리, 물체 다루는 소리, 호흡, 대사——모두 동작에 맞춰 타이밍이 잡힙니다. POV는 몰입으로 살아나고, 몰입의 절반은 소리로 이루어집니다. 효과음을 따로 구할 필요가 없습니다.
- 언어를 통한 시네마틱 카메라 제어. 숏 유형, 렌즈 질감, 움직임을 평범한 말로 묘사할 수 있습니다. POV는 모델이 직접 이해하는 카메라 용어 중 하나입니다.
- 1080p 출력. 클립은 최대 1080p(Veo 3.1에서는 더 높은 해상도 옵션도)로 렌더링되어, 프레임에 들어오는 손이 번짐이 아니라 진짜 피부로 읽힐 만큼 선명합니다.
- 세로 9:16 지원. POV 콘텐츠는 압도적으로 모바일 중심입니다. Veo 3는 진짜 세로 클립을 생성하므로, 가로 프레임을 잘라내며 몰입감 있는 가장자리를 잃을 필요가 없습니다.
- 8초 기본 클립. 한 번의 생성은 약 8초까지이며, 이는 POV '한순간'의 자연스러운 길이입니다. 더 긴 이야기는 여러 비트를 이어 붙여 만듭니다(아래 참조).
Veo 3 POV 프롬프트의 해부학
가장 강력한 POV 프롬프트는 일관된 골격을 따릅니다. 채워 넣는 다섯 개의 칸이라고 생각하세요.

- 숏 선언 — 먼저 1인칭 프레이밍을 확정한다. 「POV shot, first-person perspective…」
- 당신이 누구이고 몸이 무엇을 하는가 — 프레임에 들어오는 손·팔·발과 그 동작. 「…내 손이 나무 국자를 쥐고, 부글부글 끓는 붉은 카레 냄비를 젓는다…」
- 환경과 빛 — 어디에 있고 어떻게 보이는가. 「…따뜻하고 김이 서린 가정집 부엌, 창으로 드는 부드러운 오후 빛…」
- 카메라 거동 — '머리'가 어떻게 움직이는가. 「…카메라가 냄비로 틸트 다운했다가 가스레인지로 틸트 업, 자연스러운 가벼운 머리 흔들림…」
- 소리 — 원하는 동기화 오디오. 「…기름이 지글대는 소리, 숟가락이 냄비 가장자리를 두드리는 소리, 부드러운 끓음.」
합치면 이것이 맑고 몰입감 있는 8초 비트가 됩니다. 많은 사람이 저지르는 실수는 칸 1과 3만 쓰고('부엌에서의 POV 숏') 왜 결과가 평범한지 의아해하는 것입니다. 1인칭을 파는 것은 손과 소리입니다.
Veo 3가 이해하는 POV 카메라 용어
이 용어들을 프롬프트 안에 쌓아 질감을 조절할 수 있습니다.
- 「First-person perspective」 — 카메라가 캐릭터의 눈'이다'라는 점을 강화한다.
- 「Eye-level camera」 — 프레이밍을 자연스러운 사람 높이로 유지한다.
- 「Slight head-bob」/「natural handheld sway」 — 삼각대 고정이 아니라 체화된 느낌을 주는 미세한 움직임을 더한다.
- 「Hands enter frame from the bottom」 — 신체를 명시적으로 프레임에 초대하는, 가장 중요한 POV 단서.
- 「The camera tilts down / pans left / looks up」 — '머리'가 향하는 방향을 지시한다.
- 「Shallow depth of field」/「background softly blurred」 — 사람의 초점이 손에 든 것으로 좁혀지는 모습을 흉내 낸다.
- 「GoPro-style wide angle」 — 액션과 스포츠 POV에 가슴 장착 어안 같은 느낌을 준다.
전부 필요하진 않습니다. 그 순간에 맞는 두세 개를 고르세요.
바로 쓰는 Veo 3 POV 프롬프트 12선
복사해서 디테일을 바꾸고 생성하세요. 각각 동기화 오디오를 이미 넣은 8초 비트로 작성되어 있습니다.
1. POV: 요리
가정집 부엌의 1인칭 시점. 당신의 손이 리드미컬한 칼질 소리와 함께 토마토를 썬다.
POV shot, first-person perspective. My hands hold a chef's knife, slicing a ripe red tomato on a wooden board in a bright home kitchen. Warm morning light through a window, steam rising from a pot in the soft-focus background. The camera tilts down to the board, slight natural head-bob. Audio: rhythmic chopping on wood, a pot gently bubbling, quiet kitchen ambience.
2. POV: 여행, 도시 산책
네온 간판과 젖은 노면의 반사가 펼쳐진 밤거리 골목을 걷는다.
POV shot, first-person perspective walking through a narrow Tokyo alley at night. Neon signs glow pink and blue, reflections on wet pavement after rain. My shadow stretches ahead, slight head-bob with each step. Camera looks left toward a glowing ramen shop, then forward. Audio: footsteps on wet concrete, distant city hum, a sliding door, soft rain.
3. POV: 운전
골든아워의 해안 도로, 운전석 시점에서 손을 핸들에 올린다.
POV shot, first-person perspective from the driver's seat of a car on a coastal highway at golden hour. My hands rest on the steering wheel, the ocean glittering to the right through the windshield. Subtle handheld sway. Audio: engine hum, wind against the window, a faint song on the radio, the rhythmic click of a turn signal.
4. POV: 게임, e스포츠 리액션
키보드 불빛이 비추는 어두운 방의 게이밍 책상에서 긴장하며 앞으로 기운다.
POV shot, first-person perspective sitting at a gaming desk in a dark room lit by RGB keyboard glow. My hands rest on a mechanical keyboard and mouse, a glowing monitor in front. The camera leans slightly forward with tension. Audio: rapid mechanical key clicks, mouse clicks, a low desk-fan hum, an excited exhale.
5. POV: 아침 루틴('나의 하루')
손이 알람을 끄고 아침 햇살을 향해 커튼을 연다.
POV shot, first-person perspective. My hand reaches out to silence a phone alarm on a nightstand, then pulls open soft white curtains to bright morning sun. The camera pans across a cozy bedroom. Slight natural sway. Audio: alarm tone cut short, curtain rings sliding on a rod, birds outside, a quiet yawn.
6. POV: 호러, 스릴러
오래된 집의 어두운 복도를 흔들리는 손전등 빛과 함께 천천히 나아간다.
POV shot, first-person perspective slowly walking down a dim hallway in an old house, a flashlight beam trembling against peeling wallpaper. My hand grips the flashlight in the lower frame. The camera creeps forward, slight unsteady sway, then stops at a half-open door. Audio: slow footsteps on creaking wood, shallow nervous breathing, a distant thud, ringing silence.
7. POV: 자연 하이킹
아침의 숲길을 오르며 부츠가 이끼 낀 바위와 뿌리를 넘는다.
POV shot, first-person perspective hiking up a forest trail in the morning. My boots step over mossy rocks and roots, the camera tilts down to the path then up to sunlight breaking through tall pines. Natural head-bob with each stride. Audio: crunching gravel and leaves, steady breathing, birdsong, a light breeze through branches.
8. POV: 바리스타, 커피
카페 카운터 안쪽에서 손이 에스프레소를 탬핑하고 잔을 추출구 아래에 놓는다.
POV shot, first-person perspective behind a cafe counter. My hands tamp espresso grounds into a portafilter, lock it into a gleaming machine, and place a white cup beneath the spout. Warm cafe lighting, soft-focus pastries in the background. Camera tilts to follow each action. Audio: the grind of beans, a hiss of steam, espresso trickling into the cup, low cafe chatter.
9. POV: 언박싱
깔끔한 책상에서 손이 종이 상자를 열고 새 헤드폰을 종이에서 꺼낸다.
POV shot, first-person perspective at a clean desk. My hands cut the tape on a brown cardboard box, fold open the flaps, and lift out a sleek pair of white headphones in tissue paper. Bright, even product lighting. The camera looks straight down at the box. Audio: a box cutter slicing tape, crinkling tissue paper, a soft click as the lid opens.
10. POV: 피트니스, 헬스장
헬스장에서 초크를 묻힌 손이 집중한 리프트 전에 바벨을 쥔다.
POV shot, first-person perspective in a gym, gripping a loaded barbell on the floor. My chalked hands tighten around the bar, the camera looks down at the weights then forward to a mirror. Slight tension and sway as I prepare to lift. Audio: a deep focused exhale, the clink of metal plates, muffled gym music, a faint grunt of effort.
11. POV: 1인칭 ASMR 스타일
손이 새 노트의 비닐을 천천히 벗기고 빈 페이지를 넘긴다.
POV shot, first-person perspective at a desk in soft warm light. My hands slowly peel the plastic wrap off a new notebook, run fingers across the textured cover, and flip through crisp blank pages. Shallow depth of field. Audio: crinkling plastic, the soft crackle of pages, a gentle tap on the cover, quiet room tone.
12. POV: 어드벤처, GoPro 스타일 액션
GoPro 스타일 광각 숏: 먼지 자욱한 숲길을 산악자전거로 내려간다.
POV shot, first-person perspective, GoPro-style wide angle, mountain biking down a dusty forest trail. The handlebars and my gloved hands fill the lower frame, trees rushing past, dappled sunlight flickering. Fast natural motion and bumps. Audio: tires crunching dirt, wind rushing, the rattle of the bike frame, rapid breathing.
POV에 동기화 오디오 입히기 (다들 건너뛰는 부분)
바로 여기서 Veo 3가 특히 POV에서 앞서 나갑니다. 모델이 같은 패스에서 오디오를 생성하기 때문에, 사운드스케이프를 묘사하면 그것이 영상과 '동기화되어' 떨어집니다——발소리는 발걸음마다, 칼 두드리는 소리는 한 번의 썰기마다 맞습니다.

POV 오디오를 확실히 좋게 만드는 몇 가지 규칙:
- 소리를 한 덩어리가 아니라 레이어로 묘사하라. 전경 소리(발소리), 중경 소리(다루는 물체), 배경 환경음(도시 소음, 방의 톤)을 명시하라. 세 레이어는 '진짜 공간'으로 읽힙니다.
- 소리를 동작에 묶어라. '나무 도마에서 칼이 써는 소리'가 '부엌 소리'보다 낫습니다. 구체적이고 동작에 뿌리내린 소리일수록 더 잘 동기화됩니다.
- 호흡은 아껴 쓰되 강력하게. 한 번의 '얕은 긴장된 호흡'이나 '집중한 날숨'은 1인칭을 즉시 고정합니다. 호흡은 '당신'만 듣는 것이기 때문입니다. 남용하지 말고, 클립당 호흡 신호는 하나.
- 진짜 POV에서는 프롬프트 안에 음악을 넣지 마라. 현실의 1인칭 순간에 사운드트랙이 깔리는 일은 드뭅니다. 깨끗한 디제틱(장면 내) 사운드를 생성하고, 원하면 나중에 편집기에서 음악을 더하세요. (장면 안 음악을 '원한다'면——라디오, 클럽——음원에서 나오는 것으로 묘사하라: '라디오에서 흘러나오는 희미한 노래'.)
깨끗한 디제틱 사운드를 더 깊이 알고 싶다면 Veo 3 네이티브 오디오 프롬프팅 글과 Veo 3 오디오 생성의 작동 방식 해설을 참고하세요.
흔한 POV 실수 (그리고 해결책)
실수: 인물이 프레임에 나타난다. POV를 요청했는데 결과가 사람을 바깥에서 보여준다. 해결: 두 번 말하라——앞에 'POV shot, first-person perspective', 뒤에 '카메라는 내 손과 내 앞에 있는 것만 보여준다'. 중심인물을 빼는 것이 핵심입니다.
실수: 손이 없어 드론처럼 보인다. 신체가 프레임에 없는 1인칭 숏은 떠다니는 카메라처럼 보입니다. 해결: 항상 프레임에 들어오는 손·팔·발과 그 동작을 넣어라. 신체가 곧 POV입니다.
실수: 카메라가 너무 매끄럽다. 완벽히 안정된 움직임은 짐벌처럼 읽히지 사람의 머리처럼 보이지 않습니다. 해결: 'slight natural head-bob'이나 'subtle handheld sway'를 더하라. 액션이라면 더 나아가 'fast bumps, GoPro-style'.
실수: 평범한 소리. '부엌 소리'는 모호한 뭉텅이를 만듭니다. 해결: 각 소리를 구체적인 동작에 묶고 세 레이어를 쌓아라.
실수: 8초에 이야기를 욱여넣으려 한다. POV는 줄거리가 아니라 하나의 생생한 '순간'으로 작동합니다. 해결: 클립당 한 장소, 한 동작, 한 비트. 시퀀스는 이어 붙이기로 만들어라(다음 섹션).
더 긴 POV 시퀀스 만들기
한 번의 Veo 3 생성은 약 8초에서 멈추며, 이는 하나의 POV 비트에는 충분합니다. 더 긴 'POV 이야기'——POV: 바리스타의 하루, POV: 빗속을 걸어 집으로——를 들려주려면 여러 비트를 이어 붙입니다.
- 비트를 스토리보드로 짜라. 3~5개의 개별 POV 프롬프트를 쓰고, 각각을 분명한 순간으로 만들라(문 열기 → 코트 걸기 → 커피 내리기 시작 → 창가에 앉기).
- '당신'을 일관되게 유지하라. 모든 프롬프트에서 같은 손 묘사, 옷, 조명 스타일을 써서 시청자가 한 명의 연속된 인물이라고 믿게 하라. '왼쪽 손목에 검은 시계를 찬 내 손' 같은 표현이 클립에서 클립으로 정체성을 옮깁니다.
- 각 비트를 생성한 뒤 편집기에서 서사 순서대로 배열하라.
- 필요하면 연장하라. Veo 3.1은 클립 연장과 장면 연결을 지원해 더 긴 연속 숏을 만들 수 있습니다——한 동작에 8초 이상이 필요할 때 유용합니다. Veo 3 영상을 8초 너머로 연장하기 가이드를 참고하세요.
- 음악 베드 하나를 포맷이 요구하면 후반 작업에서 시퀀스 전체 아래에 깔되, 디제틱 사운드를 그 아래에 유지하라.
POV 비트는 짧고 자기완결적이라 이 이어 붙이기 워크플로는 빠릅니다——그리고 틱톡과 쇼츠에서 바이럴이 되는 'POV: …' 시퀀스가 바로 이렇게 만들어집니다.
세로형 POV: 틱톡, 릴스, 쇼츠
거의 모든 POV 콘텐츠는 세로로 소비되고, Veo 3는 네이티브 9:16 클립을 생성하므로 세로형을 명시적으로 요청해야 합니다. 위의 어느 프롬프트에든 'vertical 9:16 framing'을 더하면 모델이 세로 프레임에 맞게 구도를 잡아——손과 핵심 동작을 휴대폰 화면이 보여주는 중앙에 둡니다. 가로로 생성해 자르지 마세요. 1인칭을 넓고 생생하게 만드는 좌우의 몰입감 있는 가장자리를 잃습니다. 전체 해설은 Veo 3 세로 영상 가이드를 보세요.
성과를 내는 세로형 POV를 위한 짧은 체크리스트:
- 첫 1초에 후크——가장 인상적인 동작을 위로(뻗는 손, 열리는 문).
- 중요한 대상을 프레임의 가운데 3분의 1에 두라.
- 동기화 오디오도 후크로 써라. 첫 비트의 만족스러운 소리가 스크롤을 멈춥니다.
- 클립이 깔끔하게 반복되도록 '루프하기 좋은' 순간으로 끝내라.
POV에 한정한 Veo 3 비교
많은 AI 영상 도구가 1인칭 숏을 렌더링할 수 있지만, POV는 '소리'에 유난히 까다롭습니다——그리고 그것이 Veo 3의 강점입니다. 네이티브 동기화 사운드트랙 덕분에 POV 요리 클립은 칼질과 지글거림이 이미 영상에 맞물린 채 도착하지만, 경쟁하는 많은 모델은 무음 영상을 내놓아 나중에 손으로 사운드를 설계해야 합니다. Veo 3의 강한 영화 용어 이해('POV shot', 'eye-level', 'head-bob'을 안정적으로 해석)도 카메라와 씨름하는 시간을 줄이고 순간을 반복하는 시간을 늘려줍니다. 선택지를 저울질한다면 최고의 AI 영상 생성기 비교가 Veo 3를 다른 도구들과 나란히 놓습니다.
자주 묻는 질문
Veo 3가 정말 'POV'를 이해하나요? 네. POV(point of view, 1인칭 시점)는 표준 영화 용어이며 Veo 3가 직접 반응하는 숏 유형 중 하나입니다. 가장 안정적인 결과를 위해 'first-person perspective'와 프레임에 들어오는 손의 명시적 묘사를 함께 쓰세요.
왜 제 POV 클립은 여전히 인물을 바깥에서 보여주나요? 프롬프트가 모호하면 모델이 가끔 3인칭 시점으로 기본 전환합니다. 1인칭을 두 번 강화하고, 나타나야 할 손·신체 부위만 묘사하며, 카메라가 '내 앞에 있는 것'을 보여준다고 명시하세요. 계속되면 다시 생성하세요——실행마다의 편차는 정상입니다.
카메라를 삼각대가 아니라 진짜 머리처럼 느껴지게 하려면? 움직임 단서를 더하세요: 'slight natural head-bob', 'subtle handheld sway', 액션이라면 'GoPro-style, fast bumps'. 움직임 묘사가 없으면 Veo 3는 정지나 미세한 움직임으로 기웁니다.
동기화된 발소리와 호흡을 얻을 수 있나요? 네——그것은 Veo 3의 핵심 강점입니다. 소리를 레이어로 묘사하고 각 소리를 동작에 묶으세요('젖은 콘크리트 위 발소리', '얕은 긴장된 호흡'). 소리는 같은 패스에서 영상과 동기화되어 생성됩니다.
POV 클립은 얼마나 길게 만들 수 있나요? 한 번의 생성은 약 8초까지입니다. 더 긴 POV 이야기에는 여러 비트를 생성해 이어 붙이거나, Veo 3.1의 연장 기능으로 장면을 연결하세요.
POV는 세로로 생성해야 하나요, 가로로 생성해야 하나요? 틱톡, 릴스, 쇼츠에는 세로(9:16)——가로 클립을 자르지 말고 프롬프트에서 명시적으로 요청하세요. 가로는 최종 목적지가 가로형 유튜브나 웹사이트일 때만 쓰세요.
여러 클립에서 같은 '사람'을 유지할 수 있나요? 모든 프롬프트에서 일관된 신체와 복장 단서——같은 손, 시계, 소매 색, 조명——를 쓰세요. 이 연속성이 이어 붙인 시퀀스 전체에 걸쳐 한 사람이라고 시청자를 납득시킵니다.
누군가의 눈으로 촬영을 시작하라
POV는 숏폼 영상에서 가장 참여도가 높은 포맷 중 하나이고, Veo 3는 그것을 위해 유난히 잘 갖춰져 있습니다. 1인칭 카메라 언어를 이해하고, 당신의 손을 프레임에 넣으며, 그리고——결정적으로——몰입을 믿게 만드는 동기화 오디오를 생성합니다. 위의 12개 프롬프트 중 하나로 시작해, 자신의 장면을 넣고, 세로 프레이밍을 요청하고, 소리를 세 레이어로 입히세요. 그런 다음 몇 개의 비트를 'POV: …' 시퀀스로 이어 붙이면, 몇 분 만에 만든 스크롤을 멈추는 콘텐츠가 완성됩니다.
무엇이 통하는지 가장 빠르게 배우는 방법은 생성하고, 보고, 변수 하나를 바꾸고, 다시 생성하는 것입니다. Veo 3를 열고, POV 프롬프트를 넣고, 시청자를 당신의 눈 바로 뒤에 두세요.
Related Articles
Continue with more blog posts in the same locale.

Veo 3로 애니메이션 영상 만드는 법 (2026 프롬프트 & 워크플로)
Veo 3로 애니메이션과 스타일화된 카툰 영상을 만드는 완전한 시스템: 프롬프트 프레임워크, 스타일 어휘, 바로 쓰는 프롬프트 다섯 개, 캐릭터 일관성, 오디오, 품질 체크리스트.
Read article
Veo 3 네거티브 프롬프트: 원치 않는 요소와 아티팩트 제거하는 법 (2026)
Veo 3 네거티브 프롬프트로 워터마크·글자·아티팩트·CGI 흐름을 제거하는 법. 효과를 내는 표현 규칙과 복사용 제외 라이브러리.
Read article
Veo 3 텍스트 음성 변환: 영상에 보이스오버와 내레이션을 더하는 방법 (2026)
텍스트 음성 변환으로 Veo 3 영상에 보이스오버와 내레이션을 더하는 방법: 프롬프트 구조, 예시, 타이밍, 목소리 제어, 품질 점검 목록.
Read article