leangnews

2025년 12월 10일 11:01

Booking.com, 에이전트형 AI와 하이브리드 모델로 정확도 2배

Booking.com, 에이전트형 AI와 하이브리드 모델로 정확도 2배


기사 요약

  • Booking.com은 초기 대화형 추천 실험을 바탕으로 에이전트형 AI를 계층적·모듈형 구조로 확장했다.
  • 여행 도메인 소형 모델과 대형 LLM, 자체 평가를 결합한 하이브리드 전략으로 검색·순위·상담 정확도를 최대 2배 높였다.
  • 개인화 필터와 동의 기반 메모리, 가역적 의사결정과 지연시간 관리로 속도와 신뢰를 동시에 확보했다.

Booking.com의 에이전트형 AI 전략 개요

많은 기업이 에이전트형 행동과 인프라를 고려하기 전부터 Booking.com은 자사 대화형 추천 시스템을 통해 그 영역을 선제적으로 탐색했다. 회사는 작은 여행 특화 모델로 빠르고 저렴한 추론을, 대형 LLM으로 추론·이해력을, 정밀도가 중요한 영역에는 사내 도메인 맞춤 평가를 결합하는 층화·모듈형 접근을 취한다. OpenAI와의 선별적 협업까지 더해, 핵심 검색·랭킹·고객 상호작용 과제에서 정확도가 최대 2배 향상됐다. 이 모든 접근은 에이전트형 AI의 실용적 확장에 초점을 맞춘 것이다.

작은 모델은 속도, 큰 모델은 신뢰

초기에는 BERT 규모의 소형 언어 모델로 의도·주제 감지를 수행해 셀프서비스로 해결 가능한지, 인간 상담으로 이관할지 분기했다. 의도에 따라 도구를 호출하는 규칙 기반 흐름에서 출발해, 현재는 질의 분류와 RAG 트리거, API 호출과 소형 특화 모델을 조율하는 LLM 오케스트레이터로 진화했다. 이 덕분에 몇 가지 조정만으로 에이전트형 AI 스택 전반을 안정적으로 확장할 수 있었다.

에이전트형 AI 아키텍처로 확장

주제 감지 성능은 2배 개선됐고, 사람 상담원의 처리 여유는 1.5~1.7배 확보됐다. 과거 기타로 분류해 에스컬레이션하던 복잡한 토픽까지 자동화되며 셀프서비스 비중이 커졌다. 그 결과, 새벽에 프런트가 닫힌 호텔 입실 문제 같은 예외적이고 구체적인 상황에 사람 상담원이 집중할 수 있게 됐다.

개인화 혁신과 크리피하지 않은 메모리

자유 텍스트 기반 맞춤 필터링

웹사이트에는 200~250개의 검색 필터가 있어 사용자가 모두 살피기 어렵다. Booking.com은 자유 입력란을 도입해 사용자 표현을 곧바로 맞춤 필터로 변환했다. 이 방식은 클릭스트림보다 풍부한 의도 신호를 제공했고, 출시 직후에는 '자쿠지/온수 욕조' 요청이 폭발하며 해당 필터가 새로 추가됐다.

동의 중심 메모리 관리

예산 범위, 선호 호텔 등급, 장애 접근성 같은 장기 선호 기억은 개인화에 유용하지만, 반드시 사용자 동의와 자연스러운 경험을 전제로 해야 한다. Booking.com은 메모리 구축 자체보다 메모리 관리가 더 어렵다는 점을 인정하고, 동의와 프라이버시를 보장하는 방식으로만 기능을 출시한다.

빌드 vs 바이, 에이전트형 AI의 가역적 설계

에이전트는 얼마나 좁게 특화해야 하는가라는 질문에 대해, 회사는 되돌릴 수 없는 일방통행식 결정을 피하고 가역성을 우선한다. 가능하면 일반화하고, 필요한 곳에만 특화하며, 에이전트 설계를 유연하게 유지해 회복탄력성을 높인다. 각 용도별로 가장 작은 모델로 최고 품질을 내는 것을 원칙으로 한다.

지연시간과 정확도의 균형

사실 정확성과 환각 방지가 최우선이면 더 크고 느린 모델을 쓴다. 반대로 검색·추천처럼 속도 기대가 높은 과제는 지연시간을 최소화해야 한다. 토픽 감지나 엔터티 추출 같은 작업에 GPT-5처럼 무거운 모델은 쓰지 않고, 목적에 맞는 소형 모델을 선택한다.

모니터링·평가 전략

범용 모니터링처럼 수평 역량이 중요한 영역은 외부 솔루션을 도입한다. 반면 브랜드 가이드 준수가 필수인 항목은 사내에서 평가 지표와 테스트를 직접 구축한다. 이렇게 에이전트형 AI 운영 전반을 탄력적으로 관리한다.

다른 기업을 위한 실행 조언

단순하게 시작하고 빠르게 학습

처음에는 스택이 다소 복잡했지만, 더 단순하게 시작해 사용자 반응을 보며 확장했어도 충분했을 것이다. LLM·에이전트를 이제 막 도입한다면, 먼저 API 기본 기능으로 성과를 내고, 표준 호출로 해결되지 않는 요구가 생길 때 내부 도구를 고려하라. 가장 고통스러운 문제를 가장 단순한 해법으로 풀면서 제품-시장 적합성을 확인하라.

인프라 락인 회피

특정 엔드포인트를 쓰려고 클라우드 전환처럼 큰 변경을 서두르지 말라. 너무 이른 락인을 피하고, 충분한 확신이 서기 전에는 일방통행식 결정을 내리지 않는 것이 에이전트형 AI 확장의 핵심 원칙이다.

이 기사 공유하기