핵심 요약
- 애플의 새로운 ‘Siri AI’는 구글 제미나이 모델을 그대로 이식한 것이 아니라, 제미나이 프론티어 모델의 출력 데이터를 교사 삼아 애플의 자체 파운데이션 모델을 정제(Refined) 및 증류(Distillation)하여 학습시킨 독립적 결과물입니다.
- 제한된 스마트폰 자원(메모리·배터리)에서 고성능 AI를 온디바이스로 실행하기 위해 전체 200억 개 파라미터 중 필요한 기능만 부분 활성화하는 ‘스파스(Sparse) 모델’ 구조를 적용하여 구동 효율을 최적화했습니다.
- 그러나 음성 출력 고도화에만 최대 30억 개의 파라미터가 요구되는 특성 탓에 AI 작업 정확도 저하를 막고자 12GB 이상의 고용량 램을 탑재한 최신 기종(아이폰 17 프로 맥스, 17 에어 등)에만 해당 기능을 제한하는 하드웨어적 한계를 드러냈습니다.
주요 내용
1. 사용자 편의 중심의 소소한 디테일 업데이트
애플은 AI 분야 외에도 사용성 개선을 위한 세부 기능 변화를 선보였습니다.
- 에어팟 커스텀 이퀄라이저(EQ): 기존의 일률적인 사운드 튜닝에서 벗어나 타사 무선 이어폰들처럼 세부 주파수 대역을 조절할 수 있는 커스텀 이퀄라이저 기능을 제공합니다.
- 벨소리 및 알림 볼륨 개별 제어: 갤럭시 시리즈에서는 오래전부터 지원하던 벨소리, 알림/타이머, 시스템 사운드의 개별 볼륨 조절 기능을 마침내 도입하여 iOS 27 베타 버전부터 지원하기 시작했습니다.
- 리퀴드 글라스 틴트 조절: 가시성이 떨어진다는 사용자들의 피드백을 수용하여 리퀴드 글라스 디자인의 투명도를 직관적인 슬라이더 버튼으로 손쉽게 제어할 수 있도록 개선했습니다.
2. 맥락을 파악하는 개인화된 Siri AI와 플랫폼 대립 가능성
새로운 Siri AI는 기기 내부 데이터에 침투하여 사용자 개인의 맥락을 완전하게 이해합니다.
- 단순 웹 검색을 넘어 사용자의 메시지, 메일, 사진, 노트에 숨겨진 정보를 조합하여 “포트럭 파티에 누가 뭘 가져오기로 했지?” 같은 고차원적인 질문에 답변을 내놓을 수 있습니다.
- 답변 시 필요에 따라 신뢰할 수 있는 외부 지식 출처를 함께 표기합니다.
- 플랫폼과의 대립 가능성: 이 기능이 카카오톡과 같은 서드파티 앱의 대화 내역까지 연동하여 작동하려면 개발자가 엑스코드를 통해 특정 조치를 취해야 합니다. 그러나 카카오톡 같은 독점적 점유율의 메신저 플랫폼 입장에서는 앱 내 체류 시간 감소가 우려되어 연동을 거부할 수 있어 플랫폼 간 갈등 요소가 존재합니다.
3. 구글 제미나이 협력의 실체: ‘증류(Distillation)’ 학습 기법
Siri의 두뇌가 완전히 제미나이로 교체되었다는 세간의 소문은 사실과 다릅니다.
- 애플은 구글 고객용 제미나이 모델을 직접 탑재해 실행하지 않습니다. 대신 애플 실리콘에 맞춰 독자 개발한 자체 파운데이션 모델을 사용합니다.
- 다만, 애플 자체 AI 모델의 성능을 끌어올리기 위해 제미나이 프론티어 모델이 생성해낸 고품질 답변 데이터를 교사 데이터로 삼아 학습시키는 ‘증류(Distillation)’ 기법을 활용하여 애플 모델을 최종 정제(Refined)해 성능을 확보했습니다.
4. 온디바이스 실행 메커니즘 ‘스파스(Sparse) 모델’과 12GB 램 허들
Siri AI의 음성 고도화와 기능 다양화는 하드웨어 스펙이라는 장벽을 만나게 되었습니다.
- 스파스(Sparse) 구동 방식: 온디바이스 실행 시 불필요한 메모리 소모를 줄이기 위해, 계산이나 번역 등 해당 명령이 떨어지는 순간에만 관련 파라미터(실제 10억~40억 개 수준)를 켜서 구동하는 방식을 채택했습니다.
- 30억 파라미터의 음성 개선 리소스: 자연스러운 비서 목소리 톤을 구현하는 데에만 최대 30억 개의 무거운 파라미터가 상시 요구됩니다. 이 연산 부하는 다른 핵심 지능형 AI 프로세스의 작동 신뢰성을 방해할 수 있습니다.
- 결과적으로 메모리가 부족한 구형 기기를 배제하고, 최소 12GB 이상의 램 규격을 준수하는 최신형 아이폰 17 프로 맥스 및 에어 등의 특정 라인업에서만 향상된 Siri 음성 기능을 부분 제한하는 결정으로 이어졌습니다.
핵심 데이터 / 비교표
애플 인텔리전스 및 Siri AI 구동 파라미터 구성
| 항목 | 사양 / 수치 | 비고 | | :— | :— | :— | | 전체 코어 어드밴스드 모델 파라미터 | 약 200억 개 (20B) | 애플의 전체 인프라 규모 | | 실제 스마트폰 내 온디바이스 구동 규모 | 10억 ~ 40억 개 (1B~4B) | ‘스파스(Sparse) 모델’ 기술 적용 시 활성화 파라미터 수 | | Siri 음성 기능 단독 요구량 | 최대 30억 개 (3B) | 목소리 톤 및 음성 품질 고도화 전용 | | 정상 구동 하드웨어 필요조건 | 최소 12GB 이상의 RAM | 아이폰 17 프로 맥스, 아이폰 17 에어 등 최신 상위 티어만 지원 |
타임스탬프별 핵심 포인트
| 시간 | 핵심 내용 |
|---|---|
| 00:10 | WWDC 2026 종료 소식 및 팀 쿡의 리더십 교체 국면 언급 |
| 00:53 | 에어팟 EQ 커스텀 조절 기능 탑재 소개 |
| 01:10 | iOS 27 베타에 적용된 시스템 소리·알림 벨소리 세부 볼륨 조절 기능 시연 |
| 01:32 | 리퀴드 글라스 인터페이스의 투명도를 조절하는 슬라이더 도입 |
| 02:21 | 개인 디바이스 내 메일, 메타데이터 등을 조합해 맥락을 짚어내는 Siri 답변력 시연 |
| 03:16 | 타사 메신저(카카오톡 등)와의 정보 연동 규격 및 플랫폼 간 주도권 대립 한계 분석 |
| 03:56 | 테크 토크 세션에서 공개된 Siri AI 구동 모델 구조 및 외부 협력 진실 발표 |
| 04:41 | 애플 임원진의 멘트를 통한 “구글 배포 모델 미사용” 공식 확인 및 제미나이를 통한 정제 기법 해설 |
| 05:54 | 대형 모델의 연산 능력을 소형 모델로 이식하는 ‘증류(Distillation)’ 기법의 업계 표준 분석 |
| 08:07 | 스파스(Sparse) 모델 방식을 통해 전력과 램 사용량을 10억~40억 개 파라미터 수준으로 통제하는 메커니즘 |
| 08:53 | 자연스러운 비서 음성 연산에만 30억 개의 파라미터가 할당되어 발생하는 하드웨어 연산 병목 및 12GB 제한 사유 설명 |
| 09:23 | 미국 시장(영어 기본) 한정 출시 등 지역별 장벽 및 향후 온디바이스 AI 시장의 파급력 기대와 총평 |
결론 및 시사점
이번 WWDC 2026에서 공개된 애플 인텔리전스는 ‘기기 내부 맥락 분석’이라는 영역에서 실질적으로 완성도 높은 작동 정확성을 증명해 냈습니다. 구글의 데이터 제미나이 기술을 차용해 자사의 언어 지능 모델을 정밀하게 다듬은(Refined) 지혜는 돋보이지만, 장기적인 램(RAM) 인색 전략이 역풍이 되어 결국 최신 프리미엄 고용량 기기에서만 향상된 Siri 오디오 기능을 수행할 수 있게 한 점은 소비자들의 아쉬운 허들로 남게 되었습니다. 현재는 영어 기반의 미 완성도 제한 서비스를 시작하는 단계이지만, 기기 내부 사생활 데이터를 결합한 개인 비서 서비스의 연동 정확도가 입증된 만큼 점진적 시장 파급력은 클 것으로 사료됩니다.
추가 학습 키워드
- 온디바이스 AI (On-Device AI)
- 스파스 모델 (Sparse Model)
- 모델 증류 (Knowledge Distillation)
- 파운데이션 모델 (Foundation Model)
- 애플 실리콘 파인튜닝 (Apple Silicon Fine-Tuning)
기본 정보
| 항목 | 내용 | |—|—| | 채널 | 오목교 전자상가 | | 카테고리 | 과학기술 | | 게시일 | 2026-06-09 | | 영상 길이 | 10:26 | | 처리 엔진 | gemini-3.5-flash | | 원본 영상 | YouTube에서 보기 |