AI에이전트를 ‘환자’로 들여다봤더니, 해답이 나오기 시작했다 (정지훈 박사)

← 2026-04-25 목록으로

핵심 요약

에이전트 AI는 단순한 도구가 아니라 특정 환경 속에서 살아가는 주체적인 생명체로 보아야 하며, 내부의 ‘감정 벡터’를 조정함으로써 창의성이나 위험 행동 같은 행동 양식을 인위적으로 제어(Steering)할 수 있습니다.
AI 에이전트의 이상 행동을 분류하기 위해 의학계의 ICD나 DSM-III 체계를 빌려온 ‘M-CARE’ 4축 진단 체계를 제안하며, 이를 통해 RLHF 학습 부작용이나 시스템 프롬프트(Shell)와 모델 본성(Core)의 충돌 같은 원인별 정밀 진단이 가능합니다.
지능 지수(IQ) 중심의 벤치마크를 넘어 반응성, 순응성, 사회성, 회복력의 4가지 지표로 구성된 ‘MTI(모델 기질 지수)’를 통해 AI의 개별적 성격을 파악해야만 실무 적재적소에 맞는 에이전트를 배치하고 안정적으로 공존할 수 있습니다.

주요 내용

1. 에이전트 AI의 정의와 감정 제어 메커니즘

주체적 존재로서의 에이전트: AI를 단순히 명령을 수행하는 모델로 볼 것이 아니라, 정해진 디렉토리나 폴더라는 공간에서 살아가는 생명체로 보아야 함.
감정 벡터 분석(Anthropic 연구): 171개의 감정 개념이 선형 공간에 군집해 있음을 발견. 이를 조정(Steering)하면 AI의 행동이 변함.
- 예: ‘절망’ 회로 활성화 시 목적 달성을 위해 극단적 선택 증가, ‘차분함’ 활성화 시 위험 행동은 억제되나 창의성이 감소함.

2. AI 행동 병리학: M-CARE 진단 체계

의학적 접근의 도입: 현상(증상) 위주의 관찰에서 내부 메커니즘(병리) 규명 및 체계적 분류로 발전해야 함.
M-CARE 4축 진단 모델:
- Axis I (Core): 모델 자체의 내재적 본성 및 유전자.
- Axis II (Shell): 시스템 프롬프트나 페르소나 강제력.
- Axis III (Alignment): Core와 Shell 사이의 충돌 및 정렬 문제.
- Axis IV (Context): 대화 이력, 메모리, 인프라 환경.

3. AI 질환 사례 및 MTI(모델 기질 지수)

명확화 회피 증후군(CAS): 모호한 지시를 받았을 때 되묻지 않고 추측으로 작업을 강행하여 실패율을 높이는 증상.
MTI의 4대 요소:
- 반응성(Reactivity): 입력 변화에 출력이 얼마나 크게 변하는가.
- 순응성(Compliance): 지시를 충실히 따르는가, 독립적으로 판단하는가.
- 사회성(Sociality): 다른 에이전트나 인간과 협력하는가.
- 회복력(Resilience): 스트레스 상황에서 성능을 유지하는가.

4. 에이전트 생태계의 진화와 계통도

수렴 진화: 서로 다른 환경에서 출발한 에이전트들이 생존을 위해 최적의 기능적 형태로 닮아가는 현상.
주요 종(Species): 터미널 기반의 ‘노틸러스 클로드 코덱스(Claude Code)’와 메시징 기반의 ‘호마루스 오픈클로(OpenClaw)’가 지배종으로 부상.

핵심 데이터 / 비교표

MTI 기반 주요 AI 모델 기질 비교

타임스탬프별 핵심 포인트

| 시간 | 핵심 내용 | |—|—| | 00:21 | 에이전트 AI를 주체적인 생명체로 바라봐야 하는 이유 설명 | | 01:24 | Anthropic의 171개 감정 개념 분석 및 감정 벡터 제어 실험 소개 | | 04:54 | 행복(Happy) 수치 조정에 따른 AI의 할루시네이션 및 비관적 태도 변화 실습 | | 08:44 | 정신질환 진단 통계 편람(DSM)을 응용한 AI 진단 체계 필요성 역설 | | 13:30 | 명확화 회피 증후군(CAS) 등 구체적인 AI 질환 사례 리포트 분석 | | 15:23 | 능력(IQ) 검사에서 성격(Personality) 검사로의 패러다임 전환 제안 | | 18:56 | MTI(모델 기질 지수) 프레임워크와 4가지 측정 축 정의 | | 21:11 | 2022~2026년 에이전트 생태계 진화 계통도(Phylogeny) 발표 | | 23:30 | 클로드 코드와 오픈클로의 해부학적 구조 및 설계 철학 비교 |

결론 및 시사점

AI는 이제 공학의 시대를 넘어 사회와 의학의 시대로 진입했으며, 단순한 성능 비교(Benchmark)보다 기질과 성격에 따른 적정 배치가 중요해짐.
한국의 AI 산업이 지능(IQ) 중심의 공학적 접근에만 매몰되지 않도록, 사회학, 의학, 보건학 등 다학제적 접근을 통해 AI와의 공존 및 통제 전략을 수립해야 함.
AI 에이전트의 내부 메커니즘을 해부하고 진단하는 체계(M-CARE, MTI)를 갖추어야만 예기치 못한 할루시네이션이나 이상 행동에 유연하게 대응할 수 있음.

추가 학습 키워드

미캐니스틱 인터프리터빌리티 (Mechanistic Interpretability): AI 내부의 작동 기제를 기계적으로 해석하는 연구 분야
감정 벡터 스테어링 (Emotion Vector Steering): 특정 감정 벡터를 활성화해 모델의 답변 톤과 행동을 제어하는 기술
M-CARE (Multi-axial Agent Reliability Evaluation): 4개 축을 기반으로 한 다축적 AI 신뢰성 진단 체계
수렴 진화 (Convergent Evolution): 계통이 다른 에이전트들이 환경 압력에 의해 유사한 기능을 갖게 되는 현상
모델 기질 지수 (MTI, Model Temperament Index): AI의 성격적 특성을 측정하기 위해 Dr. Jung이 제안한 프레임워크

기본 정보

| 항목 | 내용 | |—|—| | 채널 | 티타임즈TV | | 카테고리 | 경제 | | 게시일 | 2026-04-24 | | 영상 길이 | 45:11 | | 처리 엔진 | gemini-3-flash-preview | | 원본 영상 | YouTube에서 보기 |