leangnews

2025년 11월 27일 10:02

앤트로픽 ‘Claude Opus 4.5’ 공개: 가격 3분의 1, 무한 채팅, 인간급 코딩

앤트로픽 ‘Claude Opus 4.5’ 공개: 가격 3분의 1, 무한 채팅, 인간급 코딩


기사 요약

  • 앤트로픽이 Claude Opus 4.5를 공개하며 가격을 최대 3분의 1로 낮추고 소프트웨어 엔지니어링 성능을 대폭 끌어올렸다.
  • SWE-bench Verified 80.9% 등 각종 벤치마크와 사내 시험에서 경쟁 모델과 인력을 앞서며 효율성도 토큰 사용량 최대 76% 절감을 입증했다.
  • 무한 채팅, Excel·Chrome 통합, 프로그램적 툴 호출 등 제품 업데이트와 함께 시장 경쟁이 심화되는 가운데 수익성·일자리 영향에 대한 논의가 커지고 있다.

개요

앤트로픽은 최신 플래그십 모델 Claude Opus 4.5를 공개하며 가격을 크게 낮추는 동시에 소프트웨어 엔지니어링 과제에서 최첨단 성능을 주장했다. 이번 출시는 OpenAI와 구글과의 경쟁을 본격화하는 전략적 조치로 평가된다.

출시와 가격 인하(Claude Opus 4.5)

Claude Opus 4.5의 요금은 입력 토큰 100만 개당 5달러, 출력 토큰 100만 개당 25달러로 책정됐다. 이는 올해 초 공개된 전작 Claude Opus 4.1(입력 15달러, 출력 75달러) 대비 약 3분의 1 수준으로, 프런티어급 AI 접근성을 크게 높였다.

벤치마크 성능과 추론력 향상

사내 테스트에 따르면 Claude Opus 4.5는 실제 소프트웨어 엔지니어링 과제를 다루는 SWE-bench Verified에서 80.9%를 기록해 OpenAI GPT-5.1-Codex-Max(77.9%), Anthropic Sonnet 4.5(77.2%), Google Gemini 3 Pro(76.2%)를 앞섰다. 내부 평가자들은 모델이 다양한 업무에서 판단력과 직관을 눈에 띄게 개선했다고 보고했으며, 개발자 리더 Alex Albert는 슬랙과 내부 문서를 연동해 우선순위에 맞는 요약을 신뢰도 있게 생산한다고 설명했다.

사내 엔지니어링 시험: 인간 후보자 초과

성능 엔지니어 채용용 사내 과제(2시간 제한)에서 Claude Opus 4.5는 병렬 추론 집계(parallel test-time compute) 기법을 활용해 역대 어떤 인간 지원자보다 높은 점수를 냈다. 시간 제한을 없애고 Anthropic의 코딩 환경인 Claude Code에서 활용했을 때는 최고 인재와 동급 성적을 보였다. 다만 협업·커뮤니케이션 등 직무 핵심 역량은 별도라는 점을 회사는 인정했다.

효율성 도약: 토큰 사용량 최대 76% 절감

성능뿐 아니라 효율성도 강점이다. 중간 노력 수준에서 Claude Opus 4.5는 Sonnet 4.5의 최고 점수를 토큰 출력 76% 감소로 재현했고, 최고 노력 수준에서는 성능을 4.3%p 높이면서도 토큰을 48% 덜 썼다. 사용자는 새로운 ‘effort’ 파라미터로 성능·지연·비용 간 균형을 조절할 수 있다. Replit는 내부 벤치마크에서 경쟁 대비 적은 토큰으로 문제를 해결했다고 밝혔고, GitHub는 코드 마이그레이션과 리팩터링에서 성능 우위와 토큰 절감을 확인했다고 전했다.

자가개선형 에이전트: 실사용 사례 확장

라쿠텐은 사무 자동화에서 Claude Opus 4.5 기반 에이전트가 4회 반복만에 최고 성능에 도달했다고 보고했다(다른 모델은 10회 후에도 미달). 이는 모델 가중치를 바꾸는 것이 아니라, 문제 해결 도구와 접근 방식을 반복적으로 개선해 ‘기술(skill)’을 최적화하는 방식이다. 코딩을 넘어 문서·스프레드시트·프레젠테이션 생성에서도 세대 간 ‘가장 큰 도약’을 체감했다는 피드백이 나왔고, 금융 모델링 기업 FRL은 내부 평가 정확도 20% 향상, 효율 15% 상승을 보고했다.

제품 업데이트: 무한 채팅·Excel·Chrome·툴 호출

기업 사용자를 겨냥한 제품군도 강화됐다. Claude for Excel이 피벗 테이블·차트·파일 업로드를 지원하며 Max·Team·Enterprise에 일반 제공되고, Chrome 확장은 Max 사용자에게 개방됐다. 대화가 길어질수록 과거 맥락을 자동 요약해 사실상 제한을 없애는 ‘무한 채팅’이 도입되었고, 개발자를 위해 함수 직접 호출을 위한 ‘프로그램적 툴 호출’과 Claude Code의 신규 Plan Mode, 데스크톱 연구 프리뷰(동시 다중 에이전트 세션)가 추가됐다.

시장 구도와 전망: 가격·성능 경쟁 가열

Anthropic는 2025년 1분기 연환산 매출 20억 달러를 달성하며 전 분기 대비 두 배 이상 성장했고, 연 10만 달러 이상 지출 고객은 전년 대비 8배 늘었다. 같은 해 OpenAI는 GPT-5 계열과 Codex Max(최대 24시간 자율 작업)를, 구글은 Gemini 3를 선보이며 경쟁이 격화됐다. Anthropic는 개발·연구 전반에서 Claude 활용으로 속도가 빨라졌다고 밝혔다. 가격 인하는 마진 압박을 키울 수 있으나 시장 저변을 확대할 전망이다. 한편 AI 시장은 10년 내 1조 달러 규모로 예상되지만, 복잡한 지식 작업 자동화 임계점에 근접한 지금도 지배적 단일 업체는 부상하지 않았다. 업계 관계자들은 Claude Opus 4.5가 어려운 코딩 과제에서 지능과 가격 모두 개선됐다며, 30분 자율 코딩에서도 일관된 성능을 보인다고 평가했다.

핵심 요약(Claude Opus 4.5)

Claude Opus 4.5는 가격 대폭 인하, SWE-bench Verified 최고 수준 성능, 토큰 효율 혁신, 자가개선형 에이전트, 무한 채팅 등으로 차별화된다. 이러한 특징은 개발자·엔터프라이즈에 즉각적 가치를 제공하는 동시에 전문 직군의 업무 방식 변화 가능성을 시사한다.

이 기사 공유하기