핵심 요약
- 구글 플로우(Google Flow)의 제미나이 옴니 플래시(Gemini Omni Flash)는 단 한 장의 인물 사진과 간단한 프롬프트만으로 옷과 신발의 일관성을 유지하며 안무 비디오를 생성하고, 에이전트 기능을 활용해 멀티플 시네마틱 컷이 포함된 고품질 광고 영상을 제작할 수 있습니다.
- 콘웨이의 생명 게임(Conway’s Game of Life) 코딩 테스트 결과, 클로드는 시킨 지시 사항만을 컴팩트하고 깔끔하게 수행(360줄 작성)하는 반면, 제미나이 3.5 플래시(안티그래비티)는 매우 빠른 속도로 지시하지 않은 색상 테마, 사운드, 프리셋 등의 풍부한 추가 기능을 구현(760줄 작성)하는 과하게 부지런한 특성을 보입니다.
- 단일 AI 모델의 벤치마크 성능에 의존하기보다, 아이디어 기획(제미나이) -> 설계 및 아키텍처 수립(클로드) -> 상세 코딩(코덱스) -> 검수 및 교차 검증(제미나이) 순으로 각 LLM의 성향에 맞춘 다중 AI 협업 워크플로우를 구축하는 것이 현업에서 가장 비용 효율적이고 강력한 방법입니다.
주요 내용
1. 구글 플로우(Google Flow)를 활용한 영상 콘텐츠 제작 성능
- 인물 기반 댄스 영상 생성: 멈춰 있는 스튜디오 인물 사진 한 장과 “K-pop 댄스를 추는 영상”이라는 간단한 프롬프트만으로 의자, 옷, 신발 등의 디테일과 일관성을 유지하며 4초 분량의 역동적인 댄스 비디오를 자연스럽게 생성합니다.
- 제품 광고 영상 제작 및 에이전트(Agent) 기능: 캔 음료(“얼박사 제로”) 이미지 한 장을 업로드하고 에이전트 요청 사항을 설정하여 광고를 제작합니다.
- 에이전트 설정 예시: “모든 씬은 임팩트 있고 빠르게 진행되며 멀티플 시네마틱 컷을 사용할 것”, “제품이 다른 각도와 환경에서 지속적으로 노출될 것” 등 상세 요청을 추가하여 10초 분량의 전문적인 커머셜 비디오를 출력할 수 있습니다.
- 모호한 입력어 인지 능력 (플로우의 강점): 사용자가 프롬프트를 한두 줄로 간단하고 모호하게 입력해도, 플로우 엔진이 사용자의 숨은 의도를 파악하여 디테일한 영어 프롬프트로 알아서 확장해 생성 연산에 반영합니다.
2. 코딩 성능 분석: 콘웨이의 생명 게임(Conway’s Game of Life) 테스트
동일한 조건의 프롬프트를 세 가지 LLM 모델에 동시에 주입하여 작동 결과물과 소스 코드를 비교 분석했습니다.
- 클로드(Claude) 4.7: 프롬프트 요구사항에 극도로 집중하여 군더더기 없이 깔끔하고 미니멀한 웹 페이지를 작성합니다. 속도는 빠르며 검은 바탕에 보라색 톤을 선호하는 경향이 있습니다.
- 코덱스(Codex) GPT-5.5 하이: 무난하고 정석적인 코드를 작성하며, 초록색/노란색 기반의 UI를 기본으로 구성합니다. 동작은 확실하나 연산 속도가 상대적으로 느립니다.
- 안티그래비티(Antigravity) 제미나이 3.5 플래시: 지시하지 않은 세세한 기능(4가지 색상 테마 스위치, 효과음 사운드 피드백, 글라이더/건 등의 고급 프리셋, 60 FPS 스피드 슬라이더 조절 장치 등)을 자발적으로 대거 추가하여 화려하고 친절한 완성본을 제공합니다.
3. 하네스 엔지니어링(Harness Engineering)의 개념
- 정의: AI 에이전트가 안전하고 안정적으로 작업을 수행할 수 있도록 외부 운영 환경을 설계 및 제어하는 기술입니다.
- 핵심 역할: 서로 다른 성향을 가진 다양한 AI 모델(클로드, 코덱스, 제미나이 등)에게 동일한 지시를 내리더라도 사용자가 머릿속에 그린 최종 목적지와 동일한 결과물이 균일하게 도출되도록 제어하는 시스템적 보완 역할을 합니다.
핵심 데이터 / 비교표
[콘웨이의 생명 게임 코딩 테스트 결과 비교]
| 비교 항목 | 클로드 오퍼스 4.7 (Claude Opus) | 코덱스 (Codex) GPT-5.5 High | 안티그래비티 (Antigravity) 제미나이 3.5 플래시 |
|---|---|---|---|
| 코딩 속도 (소요 시간) | 41초 | 253초 | 70초 (추가 기능 대거 포함 기준) |
| 작성된 코드 라인 수 | 360줄 | 700 ~ 739줄 | 760줄 |
| 디자인 및 비주얼 특성 | 미니멀, 블랙 & 보라색 톤 위주 | 정석적, 블랙 & 초록/노란색 톤 위주 | 화려함, 사용자 정의 테마 지원 |
| 특징적인 성향 | 시키는 지시사항을 군더더기 없이 정확하게 수행 (모범생 스타일) | 무난하고 표준적으로 수행하나 작업 연산 속도가 느림 | 프롬프트에 없는 다수의 편의 기능(테마, 소리, 프리셋)을 알아서 추가 (과하게 부지런한 스타일) |
타임스탬프별 핵심 포인트
| 시간 | 핵심 내용 |
|---|---|
| 01:20 | 구글 플로우(Google Flow) 플랫폼 접속 및 AI 프로(Pro) 계정 시연 준비 |
| 01:45 | 인물 사진 한 장으로 인물의 의복 디테일과 신발 일관성을 유지한 K-pop 댄스 영상 생성 확인 |
| 03:15 | 얼박사 제로 음료 캔 이미지를 기반으로 한 상업용 광고 영상 제작 과정 시연 |
| 03:55 | 구글 플로우에 탑재된 ‘에이전트(Agent) 요청 사항 추가’ 기능 및 세부 프롬프트 제어 방법 설명 |
| 05:13 | 생성된 최종 광고 비디오 확인 및 제품 로고 일관성 유지 결과 분석 |
| 07:18 | 사용자가 짧고 모호하게 작성한 프롬프트의 숨은 의도를 확장 완성하는 플로우 엔진 확인 |
| 09:12 | AI 성능 벤치마크를 위한 콘웨이의 생명 게임(Conway’s Game of Life) 개념 소개 |
| 10:18 | AI 에이전트의 안정적 제어를 위한 ‘하네스 엔지니어링(Harness Engineering)’ 개념 정의 |
| 12:22 | 세 가지 모델(클로드, 코덱스, 제미나이)의 완성 화면 구성 및 디자인 색상 선호 경향 비교 |
| 14:58 | 3개 모델의 코딩 소요 시간 및 총 코드 라인 수 정량적 비교 데이터 공개 |
| 17:49 | 단일 최고 성능 맹신을 경계하고, 작업 성향에 맞게 여러 AI를 연계 사용하는 효율적인 복합 워크플로우 제안 |
결론 및 시사점
- AI의 개인적 성향(Bias) 이해 필요: LLM은 학습 데이터에 따라 고유의 일 방식과 디자인 선호도(클로드의 미니멀리즘 vs 제미나이의 다채로움)를 가집니다. 따라서 기술의 우열만을 따지기보다 본인의 업무 스타일과 산출물 지향점에 맞는 도구를 선택해야 합니다.
- 교차 검증(Cross-Model Review)의 중요성: AI 모델들은 기본적으로 자신이 직접 생성한 작업물에 대해 스스로 후하게 평가(자기 편향)하는 경향이 있습니다. 완성도를 극대화하기 위해 한 AI가 짠 결과물을 다른 가문(Brand)의 AI에게 검수를 맡기는 ‘상호 교차 리뷰’ 파이프라인을 구축하는 것이 현명합니다.
추가 학습 키워드
- 하네스 엔지니어링 (Harness Engineering)
- 제미나이 3.5 플래시 (Gemini 3.5 Flash)
- LLM-as-a-judge (LLM 판사/평가자 기법)
- 구글 플로우 (Google Flow Omni)
- 콘웨이의 생명 게임 (Conway’s Game of Life)
기본 정보
| 항목 | 내용 | |—|—| | 채널 | 티타임즈TV | | 카테고리 | 경제 | | 게시일 | 2026-06-10 | | 영상 길이 | 23:24 | | 처리 엔진 | gemini-3.5-flash | | 원본 영상 | YouTube에서 보기 |