leangnews

2025년 11월 19일 09:02

ChatGPT로 전면 피벗한 Blue J, 기업가치 3억 달러 돌파

ChatGPT로 전면 피벗한 Blue J, 기업가치 3억 달러 돌파


기사 요약

  • 2022년 겨울, 세무 AI 스타트업 Blue J는 예측모델 중심 사업을 버리고 대규모 언어모델 기반으로 전면 전환해 성장의 천장을 깼다.
  • 1억 2200만 달러 시리즈 D 투자로 기업가치 3억 달러를 넘겼고, 고객사는 3,500곳 이상으로 늘며 매출이 12배 뛰고 일일 10~15곳이 신규 유입되고 있다.
  • 독점 콘텐츠, 세무 전문가팀, 대규모 피드백 플라이휠을 축으로 환각을 최소화하고 초단위 응답과 NPS 80대 중반을 달성하며 Thomson Reuters와 LexisNexis에 맞서고 있다.

Blue J의 결단과 도약

ChatGPT 피벗으로 재탄생한 Blue J

토론토대 세법 교수이자 CEO인 벤저민 앨러리는 2022년 겨울, 예측모델 기반의 1세대 제품을 과감히 접고 미완의 기술이던 대규모 언어모델에 회사를 올인했다. 그 결과 Blue J는 Oak HC/FT와 Sapphire Ventures가 공동 주도한 시리즈 D에서 1억 2200만 달러를 유치하며 기업가치 3억 달러를 돌파했다.

이 피벗은 Blue J를 틈새 업체에서 캐나다에서 가장 빠르게 성장하는 리걸테크 기업 중 하나로 바꿔 놓았다. 매출은 약 12배 성장했고 하루 10~15곳의 신규 고객이 유입되며 현재 3,500개 이상 조직을 지원한다. 고객에는 KPMG UK와 다수의 포춘 500 기업이 포함된다.

전환의 계기와 1세대 제품의 한계

학장 프로필 오류 사건과 확신

2023년 1월, 법대 학장의 이력 설명을 ChatGPT에 물었을 때 일부는 맞고 일부는 조작된 답이 나왔다. 명백한 실패였지만 앨러리는 바로 여기서 미래를 보았고, 환각을 제어하는 엔지니어링과 운영으로 문제를 풀자고 결심했다.

예측모델의 좁은 적용 범위

2015년에 출시한 1세대 Blue J는 특정 세무 쟁점의 판결 가능성을 예측하는 감독학습 모델이었다. 기술적으로 정교했지만 모든 세무 리서치 질문에 답하지 못한다는 치명적 한계가 있었고, 연간 매출은 약 200만 달러에서 정체됐다.

제품 성숙과 품질 혁신

90초에서 수 초로, NPS 20에서 80대로

2023년 8월 첫 LLM 제품은 응답에 90초가 걸리고 답변 절반에 문제가 있는 수준이었다. 그러나 지속 개선 끝에 현재는 응답이 수 초로 단축되고 700건 중 1건만 불만이 제기되며 NPS는 80대 중반으로 뛰었다. Blue J는 세무 전문가의 15시간 수작업 리서치를 약 15초로 줄였다는 가치 제안을 전면에 내세운다.

세 가지 전략적 축

첫째, 방대한 독점 콘텐츠다. Blue J는 Tax Analysts의 Tax Notes와 220여 개 관할을 다루는 암스테르담의 IBFD와 독점 라이선스를 체결해 미국과 글로벌 세무 정보를 통합 제공한다.

둘째, 깊은 인간 전문성이다. IRS 본부에서 기업세 브랜치 치프를 지낸 수전 매시가 이끄는 팀이 상시로 AI를 검사하고 성능을 다듬는다.

셋째, 전례 없는 피드백 플라이휠이다. 2025년 현재 누적 300만 건 이상의 세무 질의를 처리하며, 매 쿼리가 학습용 피드백을 생성한다. 주간 활성 사용자 비율은 75~85%로 전통 플랫폼의 15~25% 대비 약 5배 집중적으로 쓰인다.

모델 공급망과 수익 구조

OpenAI와의 조기 접근 파트너십

Blue J는 OpenAI와 긴밀히 협력해 차기 모델을 일찍 시험하고, 현업 세무 질의에서 추출한 현장 적합 테스트로 고품질 피드백을 제공한다. 이 과정은 복잡 추론 성능 향상에 기여한다.

멀티모델 전략과 비용 관리

Blue J는 OpenAI, Anthropic, Google Gemini, 오픈소스 모델을 상시 비교하며 특정 공급자에 종속되지 않는다. 좌석당 연 1,500달러로 무제한 질의를 제공하는 대신 변동 연산비를 자체 흡수하는 모델이지만, 기반모델 간 경쟁으로 API 단가가 하락하고 보수적 사용 예측이 적중했다. 총매출 유지율은 99%를 웃돌고 순매출 유지율은 130%에 이른다.

경쟁 구도와 운영 역량

Thomson Reuters와 LexisNexis를 상대로

2023~2024년 대형 퍼블리셔들이 AI 기능을 발표했지만, Blue J는 높은 참여 지표와 빠른 고객 증가로 모멘텀을 확보했다. 일일 업데이트 체계를 통해 IRS 규정, 유권해석, 판례, 주별 세법 개정 등 끊임없이 변하는 생태계를 따라잡는다. 현재 미국, 캐나다, 영국을 커버하며 글로벌 확장을 추진 중이다.

비전과 로드맵

글로벌 세무 인지의 운영층을 지향하는 Blue J

시리즈 D 자금은 지역과 제품 라인의 공격적 확장에 투입된다. IBFD 파트너십을 바탕으로 220여 개 관할로 확대하고, 자동 메모 생성, 세무 서식 작성, 문서 드래프팅, 세션 간 맥락 보존 등 기능을 더해 리서치 도구를 넘어 글로벌 세무 인지의 운영층으로 진화한다.

리스크와 거버넌스

환각 최소화와 책임 있는 응답

환각은 제거되진 않았지만 엄격한 엔지니어링, 콘텐츠 큐레이션, 인간 감독으로 최소화했다. Blue J의 모델은 답을 모를 때는 모른다고 응답하도록 훈련됐다. 다만 연산비 급등이나 사용 패턴 변화, 그리고 사용자의 과신으로 인한 전문적 판단 약화는 상존 위험이다.

교훈과 시사점

15시간을 15초로, 포괄성이 이긴다

성공의 핵심은 정밀도보다 포괄성이라는 문제 정의였다. 세무가는 소수 쟁점에서 95% 정답보다 모든 질문에 충분히 좋은 답을 원했다. NPS 20에서 84로의 도약은 대규모 데이터 기반의 집요한 개선, 차별화된 콘텐츠 파트너십, 세무 전문가팀의 품질 보증이 만든 결과다. Blue J가 맞선 진짜 경쟁자는 다른 스타트업이 아니라 15시간의 수작업 리서치였다.

이 기사 공유하기