leangnews
Command Palette
Search for a command to run...
2026년 01월 16일 11:02
클로드 코드, MCP 툴 서치로 레이지 로딩 도입…정확도 향상·컨텍스트 절감
기사 요약
- Anthropic이 MCP 기반 Claude Code에 ‘MCP 툴 서치’를 도입해 필요한 순간에만 도구 정의를 불러오는 레이지 로딩을 지원한다.
- 이로써 사전 도구 설명 선로딩으로 낭비되던 컨텍스트가 크게 줄어 약 134k→5k 토큰 절감과 10% 임계치 자동 전환이 구현됐다.
- 모델 정확도도 상승해 Opus 4는 49%→74%, Opus 4.5는 79.5%→88.1로 개선되며 대규모 툴셋 운용의 병목이 해소됐다.
MCP 툴 서치 업데이트 개요
Anthropic의 오픈소스 표준 MCP(모델 컨텍스트 프로토콜)는 AI 모델과 그 위의 에이전트를 외부 도구에 안정적으로 연결한다. Claude Code는 이를 기반으로 웹 브라우징, 파일 생성 등 다양한 기능을 즉시 수행하지만, 필요 여부와 무관하게 모든 도구의 설명서를 미리 읽어 컨텍스트를 잠식하는 한계가 있었다. 이번 ‘MCP 툴 서치’는 레이지 로딩을 도입해 필요할 때만 도구 정의를 불러오도록 바꾸며, 초기 데이터 기준 생태계의 ‘블로트’ 문제를 효과적으로 완화한다.
MCP 툴 서치가 해결한 ‘스타트업 세금’
기존 체계에선 MCP 서버 한 대에 50개 이상의 도구가 붙고, 7개 이상 서버 조합이 67k+ 토큰을 소모하는 등 시작 시점의 고정 비용이 커졌다(Thariq Shihipar). 20만 토큰 윈도 기준으로는 프롬프트 입력 전 이미 33% 이상을 잃는 셈이라는 분석도 나왔다(Aakash Gupta). 커뮤니티 사례에 따르면 Docker MCP 서버 하나가 135개 도구 정의만으로 125k 토큰을 차지하기도 했고, 결과적으로 ‘핵심 툴 2~3개로 제한 vs. 컨텍스트 절반 소모’의 가혹한 선택지가 강요됐다.
MCP 툴 서치 동작 원리와 레이지 로딩
이제 Claude Code는 컨텍스트 사용량을 감시하다가, 도구 설명이 가용 컨텍스트의 10%를 넘길 것으로 판단되면 전략을 전환한다. 방대한 설명서를 통째로 주입하지 않고 경량 검색 인덱스를 로드한 뒤, 사용자가 “이 컨테이너를 배포해”처럼 특정 작업을 요구하면 인덱스를 질의해 해당 도구 정의만 컨텍스트에 불러온다. 내부 테스트 기준 토큰 사용량은 약 134k에서 약 5k로 감소(약 85% 절감)하면서도 전체 도구 접근성은 유지된다. MCP 서버 운영자는 MCP 정의의 server instructions 필드가 검색 힌트 메타데이터로 중요해졌다는 점을 유념해야 한다.
MCP 툴 서치의 정확도·집중도 향상
토큰 절감 이상의 효과는 모델의 ‘집중’이다. 수천 줄의 불필요한 도구 설명이 사라지면 추론이 흔들리지 않고, 유사 명령(notification-send-user vs. notification-send-channel) 사이 구분도 선명해진다. Boris Cherny(Claude Code 책임자)는 “더 넓은 문맥, 더 나은 지시 준수, 더 많은 도구 연동”을 강조했다. 커뮤니티에 공유된 내부 벤치마크에 따르면 MCP 평가에서 Opus 4는 49%→74%, Opus 4.5는 79.5%→88.1로 정확도가 상승했다.
MCP 툴 서치가 여는 생태계와 개발자 체크포인트
사용자에게는 변화가 자연스럽게 체감되어 대화 문맥을 더 오래 유지하는 느낌을 준다. 개발자에게는 에이전트의 ‘소프트 캡’이 사실상 제거되어 데이터베이스 커넥터, 클라우드 배포 스크립트, API 래퍼, 로컬 파일 조작 등 수천 개 도구를 패널티 없이 연결할 수 있다(실사용 시점까지 비용 지연). 이는 ‘컨텍스트 경제’를 희소성에서 접근성 중심으로 바꾼다. MCP 클라이언트를 구축하는 개발자에겐 동적 로딩을 지원하는 ToolSearchTool 구현이 권장되며, IDE처럼 필요한 순간에만 확장을 불러오는 표준 ‘레이지 로딩’ 관행을 AI 에이전트 아키텍처에 정착시키는 분기점이 된다.