앤스로픽, 30시간 연속 코딩 가능한 Claude Sonnet 4.5 공개

앤스로픽, 30시간 연속 코딩 가능한 Claude Sonnet 4.5 공개

앤스로픽, 30시간 연속 코딩 가능한 Claude Sonnet 4.5 공개


기사 요약

  • 앤스로픽이 ‘Claude Sonnet 4.5’를 공개하며 SWE-bench Verified 77.2%와 30시간 이상 지속 작업 집중 능력을 앞세워 ‘세계 최고 코딩 모델’이라 주장했다.
  • 코드 생성 시장 점유율 42%로 선두지만 매출의 상당 부분이 Cursor·GitHub Copilot에 집중돼 있고, OpenAI GPT-5의 공격적 가격 전략 속에서도 Sonnet 4.5 가격은 동결됐다.
  • ASL-3 안전 장치와 프롬프트 인젝션 방어를 강화하고 개발자를 위한 Claude Agent SDK를 공개했으며, 글로벌 확장과 15억 달러 저작권 합의가 병행된다.

개요

앤스로픽이 신형 인공지능 코딩 모델 ‘Claude Sonnet 4.5’를 공개했다. 회사는 이 모델이 복잡한 다단계 업무에 30시간 이상 집중할 수 있고, 핵심 코딩 벤치마크에서 최첨단(SOTA) 성능을 달성했다고 밝혔다. 일론 머스크가 X에서 “앤스로픽이 이길 가능성은 애초에 없었다”고 비판했지만, 앤스로픽은 논평을 거절했다.

Claude Sonnet 4.5 코딩 성능과 30시간 지속 작업

Claude Sonnet 4.5는 SWE-bench Verified에서 77.2%(병렬 테스트 시 82%)를 기록했고, Terminal-bench에서도 50%로 선도적 성능을 내세웠다. 실제 컴퓨터 사용 능력을 평가하는 OSWorld에서는 61.4%로, 불과 4개월 전 Claude Sonnet 4가 기록한 42.2% 대비 큰 폭으로 향상됐다. 앤스로픽은 이 모델이 복잡한 이슈 분석, 리포 생산, 리팩터링 등 장시간의 연속 업무를 안정적으로 수행한다고 설명한다.

Claude Sonnet 4.5와 GPT-5: 가격과 경쟁 구도

OpenAI의 GPT-5가 공격적 가격 정책으로 시장을 흔드는 가운데, 일부 작업에서 Claude Opus 4는 GPT-5 대비 백만 토큰당 비용이 약 7배 높다는 초기 분석이 나왔다. 그럼에도 앤스로픽은 Claude Sonnet 4.5의 가격을 Sonnet 4와 동일하게 유지해 입력 백만 토큰당 3달러, 출력 백만 토큰당 15달러로 책정했다. 이는 성능 우위로 프리미엄 포지셔닝을 방어하겠다는 전략이지만, 기업 조달팀이 비용 대비 성능을 재평가하도록 만드는 변수로도 작용한다.

시장 점유율과 고객 집중 리스크

엔터프라이즈 기술 리더 150명을 조사한 Menlo Ventures에 따르면, 앤스로픽은 코드 생성 시장에서 42%로 21%의 OpenAI를 큰 폭으로 앞선다. 올해 초 연간 매출 런레이트 50억 달러에 도달했지만, Cursor와 GitHub Copilot이 약 14억 달러를 견인하는 등 고객 집중 리스크가 지적된다. 앤스로픽은 ‘두 고객을 제외해도 런레이트가 크게 성장했다’고 반박하며, 파트너사인 Cursor와 GitHub의 책임자들이 Claude Sonnet 4.5 성능을 지지한다는 발언을 공개했다.

보안·안전: ASL-3와 프롬프트 인젝션 방어

Claude Sonnet 4.5는 아첨, 기만, 권한 추구 등 우려되는 행동을 줄인 ‘가장 정렬된 프런티어 모델’이라는 평가와 함께 출시됐다. 프롬프트 인젝션 공격 방어에서 유의미한 진전을 이뤘으며, 화학·생물·방사능·핵(CBRN) 관련 위해 입력·출력을 감지하는 분류기를 포함한 ASL-3(Anthropic AI Safety Level 3) 보호장치를 적용했다. 초기 대비 오탐을 10배 줄였다고 회사는 밝혔다.

개발자 생태계: Claude Agent SDK 공개

앤스로픽은 Claude Code를 구동하는 동일한 인프라를 개발자에게 제공하는 ‘Claude Agent SDK’를 함께 공개했다. 회사는 “우리가 필요로 한 도구가 존재하지 않아 Claude Code를 만들었다”며, Agent SDK를 통해 각자가 해결하려는 문제에 맞춘 강력한 에이전트를 구축할 수 있다고 강조했다. 이는 Claude Sonnet 4.5의 장시간 자율 작업 능력을 실제 워크플로에 이식하는 핵심 기반이 될 전망이다.

글로벌 확장과 법적 쟁점

미국 중심의 고객 기반을 다변화하기 위해 앤스로픽은 국제 인력을 3배, 응용 AI 팀을 2025년에 5배로 확대할 계획이다. 현재 클로드 사용의 약 80%가 미국 외 지역에서 발생한다는 데이터가 이를 뒷받침한다. 한편, 회사는 저작권 침해 주장과 관련해 작가·출판사들과 15억 달러 규모로 합의했으며, 연방법원 인가에 따라 사건에 포함된 출판물 1건당 3,000달러를 지급한다.

엔터프라이즈 채택 동향과 전망

Menlo Ventures에 따르면 모델 API 지출은 6개월 만에 두 배 이상 늘어 84억 달러에 달했다. 많은 기업이 비용보다 성능을 우선시해 신형 모델 출시 후 수주 내 업그레이드하며, 전환 비용도 낮아 66%는 기존 공급자 내에서 업그레이드하는 경향을 보인다. 경쟁이 가열되며 성능은 빨라지고 비용은 낮아지는 추세로, Claude Sonnet 4.5 같은 모델의 30시간 지속 코딩 능력은 소프트웨어 개발 방식을 근본적으로 바꾸고, 분석·문제 해결·기술 전문성이 요구되는 광범위한 직무군에 구조적 변화를 예고한다.