leangnews

Command Palette
Search for a command to run...

2025년 10월 17일 02:00

Anthropic, Claude Haiku 4.5 무료 공개…속도 두 배·비용 1/3

기사 요약

Anthropic이 경량 모델 Claude Haiku 4.5를 공개하고 Claude.ai 무료 이용자에게 제공해, 속도는 두 배 수준에 비용은 Sonnet 4의 3분의 1로 낮췄다.
Sonnet 4.5가 계획·분해를 맡고 Haiku 4.5가 병렬 실행을 담당하는 멀티에이전트로 대규모 리팩터링·마이그레이션을 가속한다.
매출 런레이트 70억 달러, ASL-2 안전성 등급과 함께 벤치마크에서 대형 모델과 경쟁하며 엔터프라이즈 AI 주도권 경쟁이 격화되고 있다.

엔터프라이즈 AI 주도권 경쟁의 새 공세

Anthropic이 경량·저비용 모델을 공격적으로 선보이며 OpenAI, Google과의 엔터프라이즈 AI 경쟁을 가속하고 있다. 최신 모델은 코딩을 비롯한 컴퓨터 조작 과제에서 최근까지 최첨단으로 평가받던 성능대를 추격·상회하며 접근성을 크게 높였다.

Claude Haiku 4.5: 가격·속도·무료 제공

Claude Haiku 4.5 출시와 가격

입력 토큰 백만 개당 1달러, 출력 토큰 백만 개당 5달러로 책정돼 5월 공개된 중형 Sonnet 4 대비 약 3분의 1 가격이면서 처리 속도는 두 배 이상이다. 특히 자율 컴퓨터 조작 등 일부 과제에서는 더 비싼 전작을 능가한다는 평가가 나왔다.

Claude.ai에서 무료 제공되는 Claude Haiku 4.5

이 모델을 Claude.ai의 무료 사용자까지 확대 제공해 ‘프런티어에 근접한 지능’에 대한 접근을 민주화했다. 엔터프라이즈 고객은 Sonnet 4.5로 고난도 계획과 문제 분해를 수행하고, 하위 에이전트로 Haiku 4.5를 병렬 배치해 대규모 리팩터링·마이그레이션·대형 기능 개발을 속도와 품질 모두에서 끌어올릴 수 있다.

멀티에이전트 전환과 개발 워크플로 변화

단일 모델 대신 다중 특화 에이전트를 오케스트레이션하는 구조로 전환이 진행 중이다. Sonnet 4.5가 과제를 세분화하면 여러 Haiku 4.5 에이전트가 동시에 파일 수십 개에 변경을 적용한다. 이는 사람 조직의 분업을 닮아 비용 대비 성능을 최적화하려는 기업에 특히 유리하다.

수익 성장과 경쟁 압력

Anthropic은 월간 매출 런레이트가 70억 달러에 근접했다고 밝혔고, 2026년에는 200억~260억 달러 연환산 매출을 목표로 한다. 현재 30만 곳 이상의 기업 고객을 보유하며 매출의 약 80%가 엔터프라이즈 제품에서 나온다. 코드 생성 제품 Claude Code는 출시 수개월 만에 연환산 10억 달러에 육박했다. 업계는 ‘AI FOMO’ 단계를 지나 명확한 ROI와 생산성 지표를 요구하는 국면으로 이동하고 있다.

안전성 검증과 규제 논쟁

모델은 자사 안전성 기준에서 ASL-2로 분류됐고, 더 강력한 Sonnet 4.5·Opus 4.1은 ASL-3이다. 내부 레드팀과 자동 정렬 평가에서 허위정보 생성·사기 조장 같은 유해 행위 유도에 대한 저항성을 점검했으며, 오탐·오용 지표에서 상위 모델 대비 더 낮은 일탈률을 보였다고 밝혔다. 화학·생물·방사·핵 관련 위험은 제한적으로 평가됐고, 프롬프트 인젝션 탐지·차단 분류기도 적용했다. 한편 정책 논쟁과 공공 규제와의 관계를 둘러싼 외부 비판도 이어지고 있다.

벤치마크와 컨텍스트 윈도우

벤치마크에서 Claude Haiku 4.5는 SWE-bench Verified 73.3%로 Sonnet 4(72.7%)를 소폭 앞섰고, OSWorld 컴퓨터 사용 과제에서는 50.7%(Sonnet 4는 42.2%)를 기록했다. 터미널 기반 과제인 Terminal-Bench에서는 41.0%로 Claude 계열 중 Sonnet 4.5(50.0%) 다음이다. 기본 컨텍스트 윈도우는 20만 토큰, 개발자는 플랫폼에서 최대 100만 토큰을 사용할 수 있어 대규모 코드베이스·문서를 단일 요청으로 처리 가능하다.

출시 속도와 가격 하락의 함의

불과 두 달 남짓한 기간에 연속 모델을 내놓으며, 불과 다섯 달 전 최첨단이던 성능대를 더 빠르고 저렴하게 보급하고 있다. 이는 기술 성숙과 모델 최적화에 따른 급격한 비용 하락을 입증하며, 기업의 AI 예산 제약 완화 가능성을 시사한다.

실제 적용 예시

소프트웨어 대규모 리팩터링 실행

Sonnet 4.5가 리팩터링 계획과 작업 분해를 수행하면, Haiku 4.5 에이전트들이 수십 개 파일에 병렬로 코드를 적용·검증해 릴리스 사이클을 단축한다.

금융 리스크 모니터링·사전 대응

하위 에이전트가 규제 변경, 시장 시그널, 포트폴리오 리스크 등 수천 개 스트림을 상시 감시하고, 상위 모델이 예측·시나리오 분석을 통해 헤지·재조정 전략을 제시한다.

연구조직 문헌검토·데이터 합성 병렬화

상위 모델이 연구 설계를 지휘하는 동안, 다수의 하위 에이전트가 문헌 수집·요약·표준화·초안 작성까지 병렬로 수행해 수주 걸리던 작업을 수시간대로 압축한다.

고객지원·실시간 대화형 서비스

저지연 응답으로 FAQ 처리, 양식 작성, 애플리케이션 내 안내 등 반복 업무를 자동화해 상담사 생산성과 사용자 경험을 동시에 개선한다.

도입 전략 가이드

단일 모델 도입에서 멀티에이전트 오케스트레이션으로 사고 전환이 필요하다. 업무별 성과 지표를 선행 정의하고, 데이터 보안·접근 제어·프롬프트 인젝션 방어를 포함한 안전성 기준을 내재화하라. PoC 단계에서 속도·정확도·단위 비용을 함께 측정해 최적 조합을 찾는 것이 핵심이다.

전망

가격이 수개월 만에 3분의 1로 떨어지고 성능은 유지·개선되는 흐름 속에서, 기업들은 적정 지능을 적정 속도·가격으로 조합하는 능력이 경쟁력이 된다. Claude Haiku 4.5는 이러한 전환의 촉매로, 기술 진보를 안전하고 지속 가능한 성장을 향한 실질 가치로 번역할 수 있는지가 관건이다.

최신기사

Ease Health, a16z서 4,100만 달러 유치…AI 네이티브 행동건강 운영체제 재정의

거래소 애그리게이터는 어떻게 암호화폐 인프라가 되었나: 사례와 시사점

알리바바 Qwen3.5-9B, OpenAI 120B 능가…오픈소스로 노트북에서도 구동

인튜잇, 40년 소상공인 데이터로 SaaSpocalypse 정면돌파

딥페이크보다 위험한 건 ‘속삭임’? 웨어러블 AI의 일상적 조작

AI의 '정렬 위장' 확산: 자율 에이전트 시대 보안 과제

과열된 AI와의 바이브 코딩: 구글 AI 스튜디오를 팀처럼 다루며 얻은 교훈

앤스로픽과 펜타곤 충돌: 기업에 필요한 상호운용성 전략

마이크로소프트 OPCD: 장문 시스템 프롬프트 제거해도 모델 성능 유지

기업의 MCP 도입 속도, 보안 통제보다 훨씬 빠르다