Ramp: Lessons from Building a New AI Product - The Pragmatic Summit

← 2026-03-09 목록으로

핵심 요약

Ramp는 AI를 활용하여 기업의 재무 운영을 간소화하는 플랫폼으로, 기존에 수동으로 15분 이상 소요되던 경비 처리 과정을 15초로 단축했습니다. 이들은 단순한 AI 에이전트를 넘어, 다양한 업무에 활용될 수 있는 1000가지 이상의 기술(Skills)을 가진 단일 에이전트 개발에 집중하며 소프트웨어 개발 패러다임의 변화를 강조합니다. Ramp는 Policy Agent라는 핵심 AI 제품과 견고한 AI 인프라 및 변화된 조직 문화를 통해, 엔지니어들이 반복적 업무 대신 고부가가치 작업에 집중할 수 있도록 지원하고 있습니다.

주요 내용

01 Intro (00:05)

Ramp 소개 (01:08): Ramp는 현대 비즈니스를 위한 #1 재무 플랫폼으로, 50,000개 이상의 고객사와 125개 이상의 통화를 지원하며 100억 달러 이상의 고객 절감액과 2,750만 시간 이상의 업무 시간을 절약했습니다. Ramp의 목표는 고객의 시간과 돈을 절약하는 것입니다.
수동 경비 처리의 문제점 (01:30): 커피 한 잔의 경비를 처리하는 데 영수증 업로드 및 매칭(4분), 관리자 검토(3분), 재무 코드 및 ERP 동기화(7분) 등 총 15분 가량의 시간이 소요됩니다. 이는 회사 전체에서 누적될 경우 막대한 시간 낭비로 이어집니다.
Ramp의 AI 기반 경비 처리 (01:48): Ramp는 경비 처리 시간을 15분에서 15초로 단축했습니다. 사용자가 카드를 탭하고, 영수증 사진을 찍어 올리면 AI가 자동으로 거래를 분류하고 내역을 작성하여 경비 처리를 완료합니다. 이는 Ramp의 첫 AI 활용 사례였습니다.
시간 낭비의 영역 (02:28): 경비 처리 외에도 관리자, 직원, 임원 비서, AP 담당자, 재무/IT 팀, 조달 팀, 마감 및 보고 팀, 분석 팀, 재무 팀 등 회사 내 모든 직무에서 수동 작업으로 인해 시간이 낭비되고 있습니다. Ramp는 이러한 수동 작업을 AI 에이전트로 자동화하여 직원들이 핵심 업무에 집중할 수 있도록 합니다.
소프트웨어 패러다임의 변화 (03:36): 현재 소프트웨어 분야는 가장 빠른 패러다임 전환기를 겪고 있으며, 이는 기존의 스택(Stack)을 단순화하고 재고하는 것을 요구합니다.
Ramp의 학습 (03:52): 1000개의 에이전트를 만드는 대신, 1개의 에이전트에 1000개의 기술(Skills)을 구축하고 이를 모든 제품 표면에서 사용할 수 있도록 하는 것이 목표입니다.
자율 시스템으로의 진화 (04:19): 모든 프로세스는 트리거(Trigger), 지침(Instructions), 컨텍스트(Context), 도구(Tools), 액션(Action)으로 구성됩니다. 기존 소프트웨어는 주로 도구와 액션에 집중했지만, AI 시대에는 소프트웨어가 인간의 개입 없이 반응(React), 추론(Reason), 행동(Act)하는 자율적인 시스템으로 진화해야 합니다.
새로운 스택: 단일 UX -> 다중 기술 (05:10): Ramp는 여러 대화형 UX를 “OmniChat”이라는 단일 대화형 UX로 통합했습니다. 이는 텍스트 명령어를 통해 새로운 직원을 온보딩하는 등의 복잡한 워크플로우를 실행할 수 있습니다.
에이전트 프레임워크 (05:40): Ramp는 사내 경량 에이전트 프레임워크를 구축하여 도구(Tools) 및 플레이북(Playbooks)과의 통합을 지원합니다. 제품 관리자도 코딩 없이 20개 이상의 도구를 개발할 수 있게 되어, 복잡한 워크플로우를 자동화합니다.
에이전트 협업 (06:20): Ramp 에이전트들은 카드 결제 시 실시간 정책 검토를 수행하고, 회사의 지출 정책을 시행하며, 회계 에이전트와 연동하여 거래를 분류하고 재무 규칙을 적용합니다. 이를 통해 수동 검토를 최소화하고, 정책 위반 시에만 인간의 개입을 요청합니다.

02 The Story of Policy Agent (08:05)

Policy Agent의 필요성 (08:15): 재무팀은 매일 수많은 영수증을 수동으로 검토하며 오류를 범하기 쉽습니다. Fortune 500 고객사의 요청으로 경비 승인/거절 정책을 자동화할 기회를 얻었습니다.
Policy Agent 시연 (08:35):
- Massara ($636.36): 8명 게스트, 1인당 $79.54 (내부 $80 한도 미만), 팀 회식 목적의 유효한 업무 경비로 판단하여 승인 권장.
- OpenAI ($2177.75): 직원이 ChatGPT 기능을 테스트하는 유효한 업무 경비로 판단하여 승인 권장.
- Sunmerry Bakery ($3.25): 야근 후 구매가 아니며 주말 구매도 아니므로 거절 권장.
개발 과정의 교훈 (09:21):
- AI 제품은 한 번에 완성될 수 없습니다. 단순한 것부터 시작하여 점진적으로 복잡성을 추가해야 합니다.
- 팀원 모두(PM, 디자이너, 엔지니어)가 초기부터 완벽함을 추구하기보다 ‘충분히 좋은(good enough)’ 상태로 시작하고 끊임없이 반복(iterate)해야 한다는 문화적 이해가 중요했습니다.
- 초기 실패 원인은 모델 자체보다는 컨텍스트(Context) 전달의 문제(Context failures)였습니다. 직원의 직급이나 직책, 영수증 정보, HR 시스템 데이터 등 더 많은 정보를 LLM에 제공하는 것이 중요함을 깨달았습니다.
에이전트 스택의 진화 (10:45):
- 초기에는 간단한 LLM 호출의 연속으로 시작했습니다 (경비 -> 컨텍스트 검색 -> LLM 호출 1, 2, 3 -> 출력).
- 점차 각 경비 유형(출장, 식사, 접대)에 따라 조건부 프롬프팅을 도입하고, 영수증, 항공편 정보, 직원 레벨 등 다양한 컨텍스트를 검색하는 도구를 추가했습니다.
- 이러한 반복을 통해 완전한 에이전트 워크플로우를 구축했습니다. 시스템이 단순할수록 반복하기 쉽고, 반복할수록 시스템의 기능(Capability)과 자율성(Autonomy)은 높아지지만, 추적 가능성(Traceability)과 설명 가능성(Explainability)은 낮아집니다 (점점 ‘블랙박스’가 됨).
감사 및 정확성 (12:26):
- 사용자가 항상 옳지 않다는 점(정책 미숙지, 직원 신뢰, 태만 등)을 인지하고, Ramp는 자신들만의 ‘정확성’ 정의를 확립해야 했습니다.
- 이를 위해 PM, 디자이너, PL, VP 등 유관 부서와의 주간 레이블링 세션을 통해 Ground Truth 데이터셋을 구축했습니다.
- 에이전트의 상태와 부족한 부분을 파악하고(Alignment on agent health and holes), 팀 간 커뮤니케이션을 줄여 우선순위에 집중할 수 있었습니다.
개발 효율성 (13:26):
- 데이터 레이블링을 위해 제3자 공급업체를 활용하려 했으나, 특정 사용 사례에 맞는 도구를 찾는 것이 어려워 Streamlit 기반의 자체 앱을 개발했습니다.
- 이 앱은 사용 사례에 특화되었지만 유지보수 비용이 낮고, 비개발 직군도 개선 사항을 적용할 수 있어 효율적이었습니다.
- ‘빠른 반복’이 핵심이었으며, 초기에는 5개의 데이터 포인트만으로 평가를 시작하고 점차 확장해 나갔습니다. 누구나 쉽게 평가를 실행하고 결과를 이해할 수 있도록 했습니다.
- 평가는 모델 변경에 대한 자신감을 주었으며, 지속적인 개선으로 이어졌습니다.
‘클로드 코드’ 비유와 자율성 (14:55):
- 엔지니어에게 ‘클로드 코드(Claude Code)’는 전체 통제권을 의미하여 매우 매력적입니다. 재무팀도 자신의 경비 정책을 ‘클로드.md’로 정의하고 직접 수정할 수 있게 되면서 AI 에이전트에 대한 흥미를 높였습니다.
- 점차 에이전트의 자율성을 높여, 초기에는 단순한 ‘제안(suggestions)’만 제공했지만, 신뢰가 쌓이면서 $200 미만 거래에 대한 ‘자동 승인(auto-approvals)’ 기능으로 확장했습니다.
- 사용자는 제품 내 피드백 루프를 통해 에이전트의 작동 방식에 대해 이의를 제기하고 개선 사항을 제안할 수 있습니다.

03 AI Infrastructure & Culture (15:08)

AI 인프라스트럭처 (15:54):
- Ramp는 모든 AI 서비스를 지원하는 핵심 ‘Applied AI 서비스’를 구축했습니다.
- 이 서비스는 다양한 모델(GPT, Opus, Gemini 등)을 호출할 수 있는 원시 기능(Primitives), 구조화된 출력 생성, 시맨틱 유사성, Modal을 활용한 샌드박스 코드 실행, 배치 호출 및 워크로드 처리, 사용자 추적 기능, Frontier 모델 지원 등을 포함합니다.
- LLM 호출을 추적하는 데코레이터와 빠른 평가를 로컬 및 CI에서 실행할 수 있는 테스트 프레임워크를 제공합니다.
- Ramp는 팀들이 낮은 수준의 인프라 문제에 대해 걱정하지 않고 가치 제공에 집중할 수 있도록 이러한 복잡성을 추상화합니다.
회사 ‘툴박스’ 구축 (16:19):
- 에이전트 성능은 백오피스 컨텍스트에 의해 좌우됩니다. Ramp는 모든 팀이 접근할 수 있는 공유 도구 모음을 구축했습니다.
- 이 도구들은 내부 React 앱에서 활용되거나 프로덕션으로 배포됩니다.
- 정책 스니펫 가져오기, 일비 가져오기, 최근 거래 내역 가져오기, 직원 ID/레벨 가져오기 등 수백 가지의 도구가 존재하며, 향후 수천 개로 확장될 수 있습니다.
모델 샌드박스 및 대시보드 (17:09):
- 빠르고 격리된 모델 코드 샌드박스를 제공하여, 수많은 모델을 지원하고 배포할 수 있습니다.
- 내부 대시보드를 통해 각 팀의 AI 활용 현황(세션, 호출 수, 오류, 성공률 등)을 추적하고, 팀 간 건전한 경쟁과 영감을 유도합니다.
- 엔지니어링 팀 외에 제품, 디자인, 위험 관리, 법무, 재무, 마케팅, CX 등 다양한 팀이 이 시스템을 활용하고 있습니다.
다인용(Multiplayer) 개발 환경 (18:03):
- Ramp는 Slack 스레드 및 과거 세션의 컨텍스트를 이해하는 다인용 개발 환경을 구축했습니다. 이는 CI/CD 문제를 자동으로 처리할 수 있습니다.
- VNC를 통해 브라우저, VS Code, 터미널이 통합된 Modal 샌드박스를 제공하여 풀스택 작업을 가능하게 합니다.
- GitHub CI와 연동되어 코드 변경 시 자동으로 테스트를 실행하고, 에이전트가 패치 수정까지 제안하여 개발자가 PR을 완료하기 전에 문제를 해결할 수 있습니다.
- 이러한 접근 방식은 교차 기능 팀 간의 협업을 촉진하고, PM/디자이너가 프롬프팅 기술을 향상시키며, 에이전트의 작동 방식에 대한 피드백을 제공할 수 있게 합니다. (Ramp의 Open Inspect는 builders.ramp.com에서 오픈소스 블루프린트 확인 가능)
조직 문화의 재고 (19:09):
- AI를 통해 더 큰 ‘속도(velocity)’를 얻으면서, 엔지니어링 팀의 운영 방식을 재고해야 합니다.
- Harvard 비즈니스 스쿨의 연구에 따르면, AI 도구 사용 후 주니어 엔지니어의 생산성 향상은 미미하거나 감소하는 반면, 시니어 엔지니어의 생산성은 크게 향상되었습니다.
- 이는 단순히 코딩 속도만의 문제가 아니라, 컨텍스트 이해, 판단력, 문제를 미리 예측하는 능력 등 시니어 엔지니어의 핵심 역량이 AI 시대에 더욱 중요해짐을 시사합니다.
- 따라서 Ramp는 엔지니어들이 ‘무엇을 만들지’, ‘사용자를 얼마나 잘 이해할지’, ‘불완전한 정보로 좋은 결정을 내릴지’, 그리고 ‘프로젝트의 긴 중간 지점을 통과하며 추진력을 유지할지’에 집중해야 한다고 강조합니다.

미래 전망 (21:09)

기업은 이전에는 시도할 수 없었던 기회(인접 시장 진출, 방치되었던 레거시 시스템 재구축)를 추구할 것입니다.
AI는 ‘충분히 좋다(good enough)’는 기준을 높여, 더욱 혁신적인 사용자 경험과 더 큰 가치를 제공하게 될 것입니다.
AI 시대에는 엔지니어의 역할이 변화하여, 기술적인 숙련도와 함께 비즈니스 및 사용자 이해를 바탕으로 전략적 가치를 창출하는 역량이 더욱 중요해질 것입니다.

핵심 데이터 / 비교표

지표	전통적인 수동 처리	Ramp의 AI 에이전트
경비 처리 시간 (커피 한 잔)	약 15분	약 15초
Policy Agent 정확성 (자체 평가)	-	92.9% (‘Good Enough’ 기준)
Policy Agent 정확성 (내부 지표)	-	99.9%
Ramp Inspect를 통한 PR 병합 기여도 (월별)	-	50% 이상

참고: ‘Juniors vs Seniors’ 그래프는 Harvard 연구를 인용하여 AI 도구 사용 시 주니어 엔지니어(빨간색)와 시니어 엔지니어(파란색)의 생산성(로그 시간) 변화를 보여주며, 시니어 엔지니어의 생산성 증가가 두드러짐을 나타냅니다.

타임스탬프별 핵심 포인트

시간	핵심 내용
00:05	Ramp의 AI 제품 개발 경험 공유 목적 및 아젠다 소개.
01:08	Ramp는 현대 비즈니스를 위한 재무 플랫폼으로, 고객의 시간과 돈을 절약.
01:30	수동 경비 처리 과정은 커피 한 잔에 15분 소요, 이는 회사 전체에서 누적된 큰 낭비.
01:48	Ramp는 AI를 통해 경비 처리 시간을 15분에서 15초로 단축.
02:28	회사 내 다양한 직무에서 발생하는 수동 작업으로 인한 시간 낭비 문제 지적.
03:08	Ramp는 각 직무에 맞는 다양한 ‘에이전트’를 개발하여 수동 업무 자동화.
03:36	소프트웨어 개발 패러다임의 빠른 변화가 스택 단순화와 재고를 요구.
03:52	“1000개의 에이전트 대신, 1개의 에이전트에 1000개의 기술(Skills)을 구축하라.”
04:19	소프트웨어가 도구에서 ‘자율적인 행동 시스템’으로 진화.
05:10	단일 대화형 UX (OmniChat)를 통해 다양한 업무 처리.
05:40	사내 경량 에이전트 프레임워크 구축 및 도구/플레이북과의 통합.
06:20	Policy Agent는 실시간 정책 검토 및 회계 에이전트 연동으로 경비 자동화.
08:15	Policy Agent의 실제 작동 예시 (승인/거절 권장).
09:21	AI 제품은 ‘한 번에 완성’될 수 없으며, 단순한 문제부터 시작하여 반복해야 함.
10:45	초기 에이전트 실패는 모델 문제가 아닌 ‘컨텍스트’ 부족 때문임을 학습.
12:26	‘정확성’ 정의를 위한 주간 레이블링 세션으로 Ground Truth 데이터셋 구축.
13:26	저비용/저리스크의 자체 개발 도구(Streamlit 앱)로 개발 효율성 극대화.
14:55	‘Claude Code’ 비유를 통해 재무팀이 직접 정책을 수정하며 자율성 높이는 과정 설명.
15:08	AI 인프라와 문화는 엔지니어의 레버리지를 위한 핵심 요소.
15:54	Ramp의 ‘Applied AI 서비스’는 다양한 모델 호출, 샌드박스 실행, 배치 처리 등 지원.
17:09	회사 내부의 ‘툴박스’를 구축하여 모든 팀이 활용 가능한 도구들을 제공.
18:03	멀티플레이어 환경의 코드 샌드박스와 CI/CD 자동화 시스템 설명.
19:09	AI 도입으로 엔지니어링 팀 운영 방식을 재고해야 함.
19:39	AI 시대에 시니어 엔지니어의 ‘판단력’ 등 고유 역량이 더욱 중요해짐 강조.
21:09	AI가 기업의 새로운 기회를 창출하고, ‘충분히 좋다’는 기준을 높일 것.

결론 및 시사점

Ramp의 사례는 AI 제품 개발이 단순한 기술 구현을 넘어선 문화적, 구조적 변화를 요구함을 보여줍니다. 특히, AI 제품은 완벽함을 추구하기보다 단순한 문제부터 시작하여 ‘빠른 반복(quick iterations)’을 통해 점진적으로 개선해야 한다는 점이 강조됩니다. 또한, 에이전트의 자율성이 높아질수록 추적 가능성과 설명 가능성이 낮아지는 트레이드오프를 인지하고, 이를 극복하기 위한 정확성 정의, Ground Truth 데이터셋 구축, 그리고 효과적인 평가(Evals) 시스템이 필수적입니다. 궁극적으로 AI 인프라는 엔지니어들이 로우 레벨 작업 대신 고부가가치 비즈니스 문제 해결에 집중하도록 지원하며, 조직 문화는 AI의 잠재력을 최대한 활용할 수 있도록 끊임없이 진화해야 합니다.

추가 학습 키워드

AI 에이전트 (AI Agents)
LLM 프록시 (LLM Proxy)
프롬프트 엔지니어링 (Prompt Engineering)
MLLOps (Machine Learning Operations)
AI Ethics & Explainability (AI 윤리 및 설명 가능성)

기본 정보

| 항목 | 내용 | |—|—| | 채널 | The Pragmatic Engineer | | 카테고리 | 프로그래밍 | | 게시일 | 2026-03-09 | | 영상 길이 | 36:46 | | 처리 엔진 | gemini-2.5-flash | | 원본 영상 | YouTube에서 보기 |