이 영상의 주제
이 영상은 최근 급변하는 생성형 AI 및 로봇 공학 기술 트렌드를 다루며, 구글 I/O 전후로 발표된 다양한 신규 모델과 도구들을 소개합니다. 제미나이(Gemini)와 클로드(Claude) 등 주요 LLM의 새로운 기능, AI 에이전트, 그리고 실생활에 적용 가능한 로봇 기술과 개발자용 도구를 폭넓게 조망합니다. 입문자부터 숙련된 개발자까지 기술 생태계의 흐름을 파악하려는 시청자를 대상으로 합니다. 영상을 통해 최신 AI 경쟁 구도, 기업들의 서비스 전략, 그리고 개발 효율을 높일 수 있는 최신 툴체인을 효율적으로 파악할 수 있습니다.
다루는 기술 스택 / 키워드
- LLM/모델: Gemini 1.5 Pro/Flash, Claude 3.5 Sonnet, Llama(Meta AI), Grok
- AI 에이전트: 제미나이 스파크, Claude Computer Use, Agent View
- 개발 도구: CLI 도구, 오픈 소스 디자인 툴, Notion API
- 하드웨어/로보틱스: 피규어(Figure) 로봇, 유니트리(Unitree) 메카, 온디바이스 AI
- 핵심 개념: GEO(Generative Engine Optimization), 멀티모달 실시간 상호작용, 텍스트-음성 변환(TTS)
타임스탬프별 핵심 포인트
| 시간 | 내용 | |—|—| | 00:00 | 제미나이 옴니 및 제미나이 3.5 모델 추측 및 소식 | | 03:07 | 제미나이 스파크 에이전트 및 마우스 포인터 AI 인터페이스 | | 05:20 | 제미나이 인텔리전스 탑재 노트북 및 안드로이드 생태계 | | 08:08 | 엔트로픽 클로드 신규 기능(골, 에이전트 뷰, 금융 서비스) | | 12:00 | 클로드 API 요금제 정책 변경 및 암시장 논란 | | 16:30 | ChatGPT의 데스크탑 제어 기능 및 금융 통합 기능 | | 19:15 | 미라 무라티의 ‘싱킹 머신스’ 실시간 멀티모달 기술 | | 21:55 | 메타의 신규 모델(뮤스파크) 및 스마트 글래스 개발 환경 | | 24:00 | AI를 활용한 로봇 기술(피규어, 유니트리) 및 뇌과학 기반 영상 분석 | | 27:30 | AI 토큰 소비 지표에 대한 고찰 및 1인 창업 부트캠프 홍보 |
기본 정보
| 항목 | 내용 | |—|—| | 채널 | 조코딩 JoCoding | | 카테고리 | 프로그래밍 | | 게시일 | 2026-05-18 | | 영상 길이 | 25:19 | | 처리 엔진 | gemini-3.1-flash-lite+transcript | | 원본 영상 | YouTube에서 보기 |