핵심 요약
- AI 영상 제작의 기술적 한계인 ‘불쾌한 골짜기(Uncanny Valley)’를 극복하기 위해서는 화려한 비주얼이나 SF 중심의 자극적인 영상 대신, 사람들의 마음을 울리는 따뜻한 인간 중심의 서사(Narrative)와 감정을 자극하는 음악적 대사를 결합하는 기획력이 핵심입니다.
- 과거에는 이미지를 생성한 뒤 이를 이어 붙이는 Image-to-Video 방식으로 일관성을 유지했으나, 최근에는 ‘시댄스 2.0(Seedance 2.0)’이나 ‘클링 3.0(Kling 3.0)’ 같은 옴니(Omni) 디렉팅 도구를 통해 텍스트 프롬프트만으로 일관된 캐릭터, 카메라 무빙, 오디오를 제어하며 영화적 연출이 가능해졌습니다.
- 고비용의 AI 영상 제작 환경에서 효율성을 극대화하려면 바로 고화질 본 영상을 뽑지 않고, 저화질(480p/720p)로 연출 흐름을 먼저 검증하는 ‘프리비주얼(Pre-visual)’ 단계를 포함한 7단계의 체계적인 워크플로우를 확립해야 합니다.
주요 내용
서사와 음악을 통한 AI 불쾌한 골짜기 극복
허준호 감독은 AI 영상이 주는 특유의 어색함을 극복하기 위해 인간미 넘치는 따뜻한 서사(예: 이민자의 삶을 다룬 영화 ‘학교 맹글라’)를 기획하였습니다. 이를 위해 대형 언어 모델(LLM)을 학습시켜 시나리오를 구성하고, AI 음악 생성 플랫폼인 ‘수노(Suno)’를 통해 300~400곡 이상의 음악을 생성·테스트하면서 가사가 마치 인물의 대사나 내레이션처럼 자연스럽게 어우러지도록 연출했습니다.
AI 비디오 생성 기술의 패러다임 변화: 옴니 디렉팅
1~2년 전만 해도 이미지를 먼저 뽑아 스토리보드를 만들고 이를 영상화하는 ‘단순 생성’ 방식이 주를 이루었습니다. 그러나 최근에는 이미지 단계 없이 텍스트나 간단한 캐릭터 설정만으로 인물의 정체성, 카메라 워크, 물리적 동작, 오디오까지 일관되게 통합 제어하는 ‘옴니 디렉팅(Omni Directing)’으로 진화하였습니다. 대표적인 도구로 시댄스 2.0(Seedance 2.0)과 클링 3.0(Kling 3.0)이 활용되고 있습니다.
AI 영화 제작을 위한 효율적 워크플로우 설계
비싼 크레딧 비용과 렌더링 시간을 아끼기 위해 허준호 감독이 정립한 7단계 워크플로우는 다음과 같습니다:
- 기획 (아이디어 도출)
- 리서치 (Gemini, ChatGPT, Claude 등 LLM 협업을 통한 자료 조사)
- 시나리오 (스토리 라인 확정)
- 이미지/영상 설계 (캐릭터 및 비주얼 톤앤무드 설정)
- 프리비주얼 및 생성 (저화질 480p/720p 영상으로 사전 검증 후 본 영상 생성)
- 편집/사운드 (CapCut 편집 및 AI 사운드 툴 활용)
- 검증 및 자막 (최종 퀄리티 확인 및 자막 추가)
핵심 데이터 / 비교표
| 비교 항목 | 1위 시댄스 2.0 (Seedance 2.0 Omni) | 2위 클링 3.0 (Kling 3.0 Omni) | 3위 구글 베오 3.1 (Google Veo 3.1) |
|---|---|---|---|
| 추천 일관성 | 매우 우수 (최고 수준) | 우수 (디테일 묘사 탁월) | 보통 |
| 추천 용도 | 드라마, 영화적 연출 (시네마틱 영상) | 광고, 세밀한 캐릭터 및 사물 제어 | 초심자 연습용, 기본 영상 생성 |
| 최대 해상도 | 1080p 지원 (해상도 제한이 아쉬움) | 4K 지원 | 4K 지원 |
| 주요 장점 | 인물 및 배경 일관성 유지, 신(Scene) 간 오디오와 카메라 무빙의 완벽한 결합 | 개체 제어 툴이 확실하여 옷감의 결까지 일관성 있게 표현 가능 | 가격이 저렴하여 연습용으로 최적 |
| 비용 (가성비) | 매우 비쌈 (15초당 약 3,000원 상당) | 중간 ~ 높음 | 낮음 |
타임스탬프별 핵심 포인트
| 시간 | 핵심 내용 |
|---|---|
| 00:21 | 허준호 감독이 AI 영화계의 권위 있는 상인 ‘크로마 어워드(Chroma Awards)’ 탑 11에 선정되는 등 전 세계 영화제에서 수상한 이력 소개 |
| 01:27 | 연세대학교 디자인경영 석사 출신으로, 원래 패션 업계에 종사하다 AI 영화감독으로 빠르게 전향하게 된 개인 배경 설명 |
| 04:16 | AI 특유의 불쾌한 골짜기를 극복하기 위해 우주나 로봇 대신 인간적이고 따뜻한 ‘서사’를 중심에 두어야 하는 이유 강조 |
| 05:59 | 페이스북 1세대 인플루언서 경험과 패션 브랜드 디렉팅 경력이 AI 영상 연출력의 훌륭한 밑바탕이 되었음을 고백 |
| 07:54 | 제미나이(Gemini), 챗GPT, 클로드를 교차 사용하며 정교하게 캐릭터와 감독 스타일을 학습시켜 프롬프트를 얻어내는 과정 설명 |
| 11:15 | 8칸짜리 스토리보드 원본 이미지를 입력하고 프롬프트를 더해 자연스럽게 이어지는 15초 파쿠르 액션 영상을 생성하는 실연 |
| 12:21 | 실제 자신의 아들과 아내의 인물 소스를 활용하여 감동적인 이야기로 탄생시킨 로봇 액션 영상 사례 시연 |
| 14:31 | AI 캐릭터가 여러 컷에 걸쳐 동일한 얼굴과 자연스러운 립싱크 목소리를 유지하며 장면이 전환되는 ‘옴니 디렉팅’ 시연 |
| 17:44 | 시댄스 2.0, 클링 3.0, 구글 베오 3.1 등 핵심 AI 영상 제작 툴의 성능, 해상도, 비용 효율성을 직접 비교 분석 |
| 20:14 | 고품질 결과물을 저비용으로 뽑아내기 위해 필수적인 ‘기획부터 프리비주얼 검증 단계’에 이르는 7단계 제작 프로세스 공개 |
결론 및 시사점
- AI 비디오 기술의 고도화로 이제 누구나 고퀄리티 영상을 빠르게 생성할 수 있는 시대가 되었으나, 기술적 ‘어색함(불쾌한 골짜기)’을 넘어서 관객에게 몰입감을 주는 것은 결국 ‘인간 감독이 설계한 정교한 스토리텔링(서사)’과 ‘대사처럼 흘러가는 음악적 감수성’입니다.
- AI 영상 제작은 비용 부담이 크므로 최종 렌더링을 진행하기 전, 반드시 저화질 프리비주얼을 거쳐 편집 완성도를 조율하는 ‘스마트한 워크플로우’를 세팅하는 것이 제작 비용 절감의 핵심입니다. 초보자의 경우 고가의 툴을 바로 사용하기보다 비교적 저렴하고 음악 생성 기능이 통합된 ‘그록(Grok)’을 입문용으로 선택하는 것이 좋습니다.
추가 학습 키워드
- 불쾌한 골짜기 (Uncanny Valley): 로봇이나 AI 캐릭터가 인간과 어설프게 닮았을 때 관객이 느끼는 본능적인 거부감과 혐오감.
- 옴니 디렉팅 (Omni Directing): 캐릭터 정체성, 카메라 무빙, 오디오, 물리 연산을 하나의 워크플로우 안에서 통합 조율하여 영상을 생성하는 패러다임.
- 프리비주얼 (Pre-visualization): 본 생성에 들어가기 전 저화질로 연출의 흐름과 앵글을 미리 시뮬레이션해 보는 사전 시각화 작업.
- 수노 (Suno): 텍스트 지시어를 기반으로 작사, 보컬, 악기 구성을 포함한 고품질의 음악을 생성해 주는 AI 오디오 솔루션.
- 시댄스 2.0 (Seedance 2.0) / 클링 3.0 (Kling 3.0): 캐릭터의 외형과 연속성을 유지하며 시네마틱한 고품질 비디오를 제작할 수 있는 대표적인 옴니 AI 모델.
기본 정보
| 항목 | 내용 | |—|—| | 채널 | 티타임즈TV | | 카테고리 | 경제 | | 게시일 | 2026-05-26 | | 영상 길이 | 31:17 | | 처리 엔진 | gemini-3.5-flash | | 원본 영상 | YouTube에서 보기 |