‘안티-ChatGPT’ Westlaw 딥 리서치, 20시간 업무를 10분으로

‘안티-ChatGPT’ Westlaw 딥 리서치, 20시간 업무를 10분으로

‘안티-ChatGPT’ Westlaw 딥 리서치, 20시간 업무를 10분으로


기사 요약

  • 톰슨로이터 Westlaw의 멀티에이전트 연구 플랫폼 ‘딥 리서치’는 속도보다 깊이를 택해 평균 10분 동안 체계적으로 법률 조사를 수행한다.
  • 방대한 큐레이션 데이터와 인라인 인용, Westlaw 도구세트와 결합해 오류와 환각을 줄이고 양측 논점을 균형 있게 제시한다.
  • 다중 모델 전략과 전문 편집 네트워크를 바탕으로 변호사의 디스커버리·브리핑 시간을 대폭 단축하며 타 산업에도 시사점을 제공한다.

속도보다 깊이: Westlaw 딥 리서치의 등장

톰슨로이터 Westlaw가 선보인 ‘딥 리서치’는 즉답 경쟁이 아닌 심층성에 베팅한 멀티에이전트 법률 연구 플랫폼이다. 평균 10분 동안 계획을 세우고 실행하며, 200억 건이 넘는 최신 판례·법령·행정 결정·2차 자료·편집 콘텐츠로 큐레이션된 데이터셋을 바탕으로 정교한 보고서를 만들어낸다.

RAG를 넘어: 오류를 줄이고 인용으로 검증하다

일반 RAG가 문서를 불러와 요약하는 데 그친다면, 딥 리서치는 가설을 쪼개고 응답을 분석하며 다음 사례로 ‘빵가루 흔적’을 따라가는 식으로 연구 계획을 반복 갱신한다. 결과물에는 인라인 인용이 달려 있어 바로 원문 판례·법령으로 이동할 수 있어 검증 고리가 크게 짧아진다.

작동 방식: 에이전트가 전 과정을 수행

인간은 탐색 과정을 열람할 수 있지만 실행은 전적으로 에이전트가 맡는다. 초기 RAG 도구가 길게 나열한 검색 결과를 사람이 일일이 거르던 방식에서, 딥 리서치는 양측 논거와 대표 판례를 구조화해 제시하고 관할권별로 설득력 있는 권위를 찾아준다.

모델 전략과 데이터셋: 멀티모델+전문 큐레이션

Deep Research는 특정 단일 모델에 묶이지 않는다. OpenAI·Anthropic·Google 등 프런티어 모델과 자체 실험 모델을 과업별로 조합하며, 법원 의견·연방/주 법령·SEC·EPA 등 행정 결정과 실무가·학계·서드파티 저작물까지 폭넓은 2차 자료를 사용한다. 수백 명의 변호사 에디터가 매일 분류 체계를 업데이트하고 무효화된 법을 표시해, 웹 전반이 아닌 정제된 최신 컬렉션 위에서 에이전트가 작동하도록 한다.

환각보다 큰 문제: ‘틀린 사실’ 선택

가짜 조항이나 존재하지 않는 사건을 꾸며내는 전형적 환각은 인라인 인용과 폐쇄형 컬렉션 덕분에 식별·차단되기 쉽다. 더 큰 위험은 오래되었거나 신뢰도 낮은 자료를 임의로 선택해 ‘틀린 사실’을 답하는 경우인데, Westlaw 보고서는 모든 결론을 즉시 확인 가능한 출처에 연결해 이 문제를 최소화한다. 물론 100% 무환각을 보장하는 시스템은 아직 없다.

실무 효과: 20시간을 10분으로, 더 느리게도 더 정확하게

복잡한 사안에서 10~20시간 걸리던 법률 조사는 딥 리서치로 크게 단축된다. 기본은 10분이지만 7분·3분 옵션과 함께 20분 심화 모드도 준비 중이며, 변호사들은 즉시성보다 숙고된 결과를 선호한다. 다만 과도한 반복으로 ‘노이즈’가 늘지 않도록 수익 체감 구간을 지속 탐색하고 있다.

Westlaw 도구세트: KeyCite·West Key Number System

분류 도구인 West Key Number System은 표현이 달라도 주제상 유사한 판례를 연결한다. KeyCite는 특정 사건·법령의 유효성(후속 법으로 변경·무효 여부)과 인용 맥락을 추적해, 검색어 일치 그 이상으로 관련성을 신호한다. 에이전트는 이들 도구를 활용해 숙련 변호사처럼 복잡한 연구를 반복적으로 풀어간다.

법률을 넘어: ‘안티-ChatGPT’의 비즈니스 가치

즉답 챗보다 느리지만 더 깊은 분석을 지향하는 ‘안티-ChatGPT’ 접근은 타 산업에도 설계를 제시한다. 딥 리서치처럼 에이전트에 시간을 더 주고, 신뢰 가능한 도메인 데이터와 검증 도구를 결합하면, 속도 경쟁을 넘어 실질적 비즈니스 가치를 창출할 수 있다.