leangnews
Command Palette
Search for a command to run...
2026년 02월 13일 13:02
크롬, WebMCP 초기 미리보기 공개… AI 에이전트용 웹 표준의 서막
기사 요약
- 구글과 마이크로소프트가 공동 설계한 WebMCP가 크롬 146 카나리에서 초기 미리보기로 공개돼, navigator.modelContext를 통해 웹사이트가 AI 에이전트에 구조화된 도구를 노출할 수 있게 됐다.
- 스크린샷 기반·DOM 파싱 중심의 브라우저 자동화 대비 비용과 지연을 줄이고 신뢰성을 높이며, 기존 프런트엔드 자바스크립트를 재사용해 개발 속도를 개선한다.
- WebMCP는 완전 자율 대신 인간 개입 협업에 초점을 두고 MCP와는 백엔드/프런트엔드로 역할을 분담하며, 2026년 전후 본격 확산이 예상된다.
모든 웹사이트를 AI 에이전트용 도구로: WebMCP 미리보기
AI 에이전트가 웹사이트를 방문하면 사람 눈에 맞춰 설계된 UI를 해석하느라 스크린샷 전송과 DOM 파싱에 의존해 비용과 지연이 커집니다. 구글 크롬 팀은 크롬 146 카나리에서 WebMCP(Web Model Context Protocol) 초기 미리보기를 공개했으며, W3C Web Machine Learning 커뮤니티 그룹에서의 인큐베이션을 거쳐 구글과 마이크로소프트가 공동 개발했습니다. 새 브라우저 API인 navigator.modelContext를 통해 어떤 웹사이트든 에이전트가 직접 호출 가능한 구조화된 도구를 공개할 수 있습니다.
왜 필요한가: 스크린 스크래핑과 DOM 파싱의 한계
스크린샷 기반 방식은 멀티모달 모델이 화면 요소를 정확히 파악하기 어렵고, 이미지 한 장이 수천 토큰과 높은 지연을 유발합니다. DOM 파싱은 과도한 태그·CSS·구조 마크업이 실제 과업과 무관한데도 컨텍스트 창을 차지해 추론 비용을 키웁니다. 결과적으로 사람이 몇 초면 끝낼 상품 검색도 필터 클릭, 스크롤, 결과 해석 등 수십 단계의 연쇄 추론 호출이 필요해집니다. WebMCP는 사람이 보는 화면이 아닌, 모델이 필요로 하는 ‘행동 가능 데이터’로 바로 연결하는 표준입니다.
WebMCP의 구성: 두 가지 API, 하나의 표준
선언형 API(Declarative): 기존 폼을 도구로 노출
이미 잘 구조화된 HTML 폼이 있다면 툴 이름과 설명을 마크업에 추가하는 것만으로 에이전트가 해당 폼을 호출할 수 있습니다. 별도 재설계 없이도 현재 폼 자산만으로도 상당 부분을 활용할 수 있습니다.
명령형 API(Imperative): 동적 상호작용을 클라이언트에서
registerTool()을 통해 검색, 주문 등 자바스크립트 함수와 파라미터 스키마, 자연어 설명을 브라우저 측에 정의합니다. 예를 들어 searchProducts(query, filters)나 orderPrints(copies, page_size)를 도구로 등록하면, 에이전트는 필터 드롭다운을 누르고 페이지를 스크롤하며 스크린샷을 찍는 대신 한 번의 구조화된 호출로 JSON 결과를 얻습니다. 이처럼 WebMCP 한 번의 호출이 수십 번의 브라우저 조작을 대체할 수 있습니다.
엔터프라이즈 효과: 비용, 신뢰성, 개발 속도
비용은 스크린샷 캡처·멀티모달 추론·반복 DOM 파싱의 연쇄를 단일 도구 호출로 바꿔 토큰 사용량을 크게 줄입니다. 신뢰성은 사이트가 “지원 함수, 매개변수, 반환값”을 명시한 도구 계약을 공개함으로써 추측이 아닌 확정적 실행이 가능해져 UI 변경이나 동적 로딩에도 견고해집니다. 개발 속도는 기존 프런트엔드 자바스크립트를 재사용해 별도 백엔드 인프라나 새로운 서버 프레임워크 없이도 기능을 에이전트 도구로 승격시킬 수 있어 빨라집니다.
사람-에이전트 협업이 기본값
WebMCP는 완전 자율 에이전트가 아니라 인간 개입(human-in-the-loop)에 중점을 둡니다. 크롬의 Khushal Sagar는 철학을 지탱하는 세 기둥으로 컨텍스트(화면에 보이지 않는 내용까지 포함한 사용자 맥락), 역량(에이전트가 대행할 수 있는 행동), 조정(에이전트가 자체 해결이 어려울 때 사용자와의 주고받기 제어)을 제시합니다. 예시로, 사용자가 친환경 결혼식 드레스를 찾자 에이전트가 쇼핑 사이트의 getDresses()와 showDresses() 같은 도구를 호출해 제품 데이터를 받아 ‘칵테일 드레스에 적합’ 기준으로 자체 필터링하고, showDresses()로 페이지를 갱신합니다. 한편, 헤드리스·완전 자율 시나리오는 비목표로, 그 영역은 구글의 A2A(Agent-to-Agent) 같은 기존 프로토콜이 담당합니다.
MCP를 대체하지 않고 보완
WebMCP는 Anthropic의 MCP(Model Context Protocol) 대체제가 아닙니다. MCP가 JSON-RPC를 따르는 서버 간 백엔드 프로토콜이라면, WebMCP는 브라우저 내부의 클라이언트 사이드 표준입니다. 예를 들어 여행사는 ChatGPT·Claude와의 직접 통합을 위해 백엔드 MCP 서버를 유지하면서, 소비자 웹사이트에는 WebMCP 도구를 배치해 사용자의 실세션 맥락에서 브라우저 기반 에이전트가 예약 흐름과 상호작용하도록 할 수 있습니다. 용도는 분리되지만 상호 보완적입니다.
로드맵과 표준화 진행
현재 WebMCP는 크롬 146 카나리에서 chrome://flags의 “WebMCP for testing” 플래그로 활성화할 수 있으며, 문서·데모는 Chrome Early Preview Program을 통해 제공됩니다. 다른 브라우저 일정은 미정이지만, 사양 공동 저작에 참여한 마이크로소프트로 미루어 엣지 지원 가능성이 점쳐집니다. 업계는 2026년 중하반기 전후로 공식 발표를 예상하며, W3C 커뮤니티 인큐베이션 단계에서 공식 초안으로의 전환이 진행 중입니다. Sagar의 비유처럼 WebMCP는 웹 상의 AI 에이전트 상호작용을 위한 ‘USB‑C’가 되는 것을 목표로 하며, 성패는 브라우저 벤더와 웹 개발자의 채택에 달려 있습니다.
실제 적용 예시
전자상거래: 구조화된 상품 검색 도구
쇼핑몰이 searchProducts 도구를 WebMCP로 등록하면, 에이전트는 단일 호출로 필터·정렬·페이지네이션을 반영한 결과를 JSON으로 받아 사용자 취향에 맞춘 추천을 즉시 제시할 수 있습니다. 이는 스크롤·클릭·스크린샷 반복을 제거해 응답 지연과 비용을 함께 낮춥니다.
여행 예약: 브라우저 세션 맥락 활용
여행사는 백엔드 MCP로 파트너사와 시스템 간 자동화를 유지하고, 소비자용 사이트에는 WebMCP 도구를 배치해 사용자의 로그인 상태·장바구니·최근 조회 내역 등 세션 컨텍스트를 활용한 좌석 선택·부가 서비스 추가를 에이전트가 보조하도록 할 수 있습니다. 사용자는 화면을 보며 검토·승인하고, 에이전트는 반복 입력을 대신 처리합니다.