leangnews

2026년 01월 05일 14:02

미스트랄, ‘Mistral OCR 3’ 공개: 1,000쪽 2달러·벤치마크 승률 74%

미스트랄, ‘Mistral OCR 3’ 공개: 1,000쪽 2달러·벤치마크 승률 74%


기사 요약

  • 프랑스 미스트랄 AI가 3세대 OCR 모델 Mistral OCR 3를 공개하며 엔터프라이즈 문서 디지털화를 생성형 AI 도입의 출발점으로 제시했다.
  • 양식·스캔·복잡한 표·필기 처리에서 경쟁 제품 대비 74% 승률을 주장하고, 1,000쪽당 2달러(일괄 처리 50% 할인)로 공격적으로 책정했다.
  • Document AI와 Mistral AI Studio에 통합돼 클라우드·VPC·온프레미스 배포와 데이터 보안, 맞춤화 중심 전략으로 OpenAI·Anthropic에 맞선다.

미스트랄, 엔터프라이즈 문서 디지털화 위한 Mistral OCR 3 전격 출시

기업가치 117억 유로의 미스트랄 AI가 3세대 광학문자인식 모델 ‘Mistral OCR 3’를 공개했다. 회사는 문서 디지털화를 생성형 AI의 실전 도입을 위한 첫 단추로 규정하며, 벤치마크에서 경쟁 제품 대비 74% 승률을 주장했다. 가격은 1,000쪽당 2달러, 대량 처리 시 50% 할인으로 기존 엔터프라이즈 문서 처리 솔루션 대비 크게 낮다.

왜 문서 디지털화가 우선인가

엔터프라이즈 AI 전환의 병목(문서 디지털화)

미스트랄 CRO 마르조리 자니에비치는 수많은 대기업이 아직 디지털화되지 않은 핵심 데이터를 대량 보유하고 있다고 지적했다. 이 데이터는 맞춤형 시스템·에이전트의 기반이자 경쟁우위를 만드는 ‘보이지 않는 해자’지만, 비디지털 상태 때문에 PoC를 넘어 실전 운영으로의 전환이 지연돼 왔다.

워크플로 자동화와 지식 자산의 해방

문서 디지털화는 수십 년간 축적된 사내 지식을 열어 주고, 문서 의존도가 높은 산업에서 일상 업무의 자동화를 가능하게 한다. 자니에비치는 핵심 데이터가 완전히 디지털화될 때 비로소 ‘변혁적’ 워크플로 자동화가 현실화된다고 강조했다.

규제 산업 전반의 적용 시나리오

금융: AML·KYC 고도화

계좌 개설, 고객확인(KYC), 자금세탁방지(AML) 등 연간 수백만 건의 문서 심사가 필요한 금융권에서 투명한 거버넌스와 검사 가능성은 필수다. 은행들은 디지털화의 속도·정확도·성능 향상을 요구하고 있다.

보험·의료·제조: 복잡 서류와 멀티모달 증빙의 연결

보험사는 파손 사진, 필기 보고서, 약관 문서를 자동 처리 엔진과 연결해야 하며, 의료기관은 입원 동의서·병력·처방전이 종이와 디지털에 혼재돼 있다. 제조업은 난도 높은 기술 문서에서 가치 정보를 추출해 생산 가속과 혁신으로 잇는 데 큰 잠재력이 있다.

Mistral OCR 3의 핵심 성능

필기·복합 표·손상 스캔에 대한 강인성

Mistral OCR 3는 필기체, 혼합 주석, 인쇄 양식 위의 필기 텍스트를 해석하고, 헤더·병합셀·다중 행/열 계층을 가진 복잡한 표 구조를 재구성해 레이아웃을 보존하는 HTML 표 태그로 출력한다. 또한 압축 아티팩트, 기울어짐, 왜곡, 저해상도, 배경 노이즈 등 레거시 문서의 난제를 크게 개선했다고 밝힌다.

생성형·에이전트형 AI의 토대

IDC의 팀 로는 “OCR은 생성형 AI와 에이전트형 AI를 가능하게 하는 기초”라며, 고충실도 텍스트·내장 이미지 추출 역량이 데이터의 문맥을 풍부하게 해 경쟁우위를 만든다고 평가했다.

스튜디오와의 수직 통합: 실험에서 운영으로

Document AI와 Mistral AI Studio 연계

Mistral OCR 3는 미스트랄의 엔터프라이즈 AI 개발·운영 플랫폼인 Mistral AI Studio의 Document AI 구성요소 안에서 구동된다. 관측성, 에이전트 런타임, AI 레지스트리 등 운영 인프라와 직결돼, 문서 처리 결과를 다른 모델·워크플로로 자연스럽게 이어 붙인다.

클라우드·VPC·온프레미스 유연한 배포

규제 산업을 고려해 퍼블릭 클라우드, 가상사설클라우드(VPC), 온프레미스 환경을 모두 지원한다. 많은 고객이 자체 GPU에서 모델을 구동하도록 설계돼 “데이터가 회사 안에 머문다”는 안도감을 준다. 미스트랄은 “훈련에 고객 데이터를 사용하지 않는다”고 못 박았으며, 최근 HSBC와의 생산성 도구 협업은 엄격한 보안 요구에 대한 신뢰를 방증한다.

가격 전략과 ‘관문 제품’ 포지셔닝

1,000쪽 2달러, 일괄 50% 할인

공격적인 가격은 경쟁 솔루션을 압도하며, 기업이 송장 구조화, 기업 아카이브 디지털화, 기술·과학 보고서의 정제 텍스트 추출, 엔터프라이즈 검색 개선 등 즉효를 보기 쉽게 한다. 미스트랄은 Mistral OCR 3를 수익 중심이 아닌 진입용 ‘관문 제품’으로 위치시키고, 스튜디오 기반의 복잡 워크플로 전환, R&D 공동 개발, 생산성 도구(Le Chat, Mistral Code)로의 확장을 노린다.

경쟁 구도와 지정학·규제 리스크

OpenAI·Anthropic과의 자본 격차, 그리고 EU-미국 긴장

미스트랄은 9월 ASML 주도로 약 20억 달러 시리즈 C를 유치했지만, 5,000억 달러 가치 평가의 OpenAI, 3,500억 달러 가치의 Anthropic에 비하면 자본 격차가 크다. 한편 미국 행정부가 EU 기술 규제에 보복을 경고하고, EU는 역내 모든 기업에 공정 적용을 강조하는 등 긴장이 고조돼 유럽 AI 기업의 미국 시장 전개에 불확실성이 생겼다. 미스트랄은 Apache 2.0 라이선스와 지역 제한 없는 전 세계 제공을 내세워 중국계 경쟁사와 차별화를 시도한다.

제품 생태계와 파트너십

미스트랄은 12월에 오픈 웨이트 계열 ‘Mistral 3’, 코딩 모델 ‘Devstral 2’, 자연어 기반 코드 자동화 CLI ‘Mistral Vibe’를 연이어 공개했다. Microsoft Azure Foundry와의 유통, AWS Bedrock의 Mistral Large 3·Ministral 3 탑재 등 인프라 제휴도 확대 중이며, Mistral OCR 3 역시 해당 채널로 제공될 예정이다.

맞춤화가 곧 ROI: 작은 모델의 실용성

공동창업자이자 수석과학자 기욤 랑플은 “대부분의 엔터프라이즈 과제는 소형 모델과 정교한 파인튜닝으로 해결 가능하다”고 말한다. 자니에비치 역시 기성형 AI의 한계를 지적하며, 모델·기술의 맞춤화와 통제권 환원이 실전 가치 창출의 핵심이라고 강조한다.

출시와 접근 방법

Mistral OCR 3는 미스트랄 API와 Mistral AI Studio의 Document AI 인터페이스에서 화요일부터 사용 가능하다. 개발자는 식별자 ‘mistral-ocr-2512’로 접근할 수 있다. 또한 접근성 측면에서도 인쇄물·필기·스캔 문서를 화면낭독기 친화적 검색 가능 포맷으로 바꿔 교육·정부의 장애 접근성 준수를 돕는다.

이 기사 공유하기