오픈AI, 7시간 자율 실행 가능한 GPT-5-Codex 공개

작성일시 2025년 09월 17일 20:01163조회수

Table of Contents

기사 요약

오픈AI가 소프트웨어 엔지니어링 전용 모델 GPT-5-Codex를 공개하고 Codex 전반을 통합 업데이트했다.
새 모델은 적응적 추론으로 단순 버그부터 대규모 리팩터링까지 처리하며, 대형 작업을 최대 7시간 이상 독립 실행한다.
CLI·IDE 확장·클라우드 에이전트·자동 코드 리뷰가 강화됐고, 요금제는 ChatGPT 유료 플랜에 포함된다.

GPT-5-Codex 한눈에 보기

오픈AI는 개발자 터미널, IDE, GitHub, 웹, ChatGPT 앱 전반에서 통합 경험을 제공하기 위해 소프트웨어 엔지니어링 특화 모델을 공개했다. 9월 15일부로 클라우드 작업과 코드 리뷰의 기본 엔진이 되었으며, 로컬에서는 CLI와 IDE 확장을 통해 사용할 수 있다. 향후 API 옵션으로도 제공해 타 애플리케이션에 쉽게 통합할 수 있도록 할 계획이다.

에이전틱 코딩 최적화와 핵심 기능

적응적 추론과 장시간 독립 실행 (GPT-5-Codex)

일반형 GPT-5와 달리 에이전틱 코딩에 맞춰 튜닝되어, 개발자의 자율형 동료처럼 코드 작성·실행·수정을 연속적으로 수행한다. 작업 난이도에 따라 추론 시간을 가변적으로 조절하며, 짧은 질의에는 빠르게 응답하고 복잡한 프로젝트는 최대 7시간 이상 독립적으로 실행해 리팩터링을 끝까지 밀어붙인다. 하위 모델 라우팅에 의존하지 않고 모델 자체가 필요한 사고 시간을 동적으로 결정해, 실행 중 계획을 수정하는 등 중간 적응도 가능하다.

실전 데이터로 학습된 코드 리뷰와 리팩터링

디버깅, 테스트 추가, 제로부터의 프로젝트 구성, 대규모 리팩터링에 이르기까지 실제 엔지니어링 작업으로 학습됐다. 코드 리뷰에 특화되어 코드베이스를 가로지르며 의존성을 추론하고, 테스트를 실행해 정확성을 검증한다. 내부 프로세스에도 이미 투입되어 매일 수백 건의 이슈를 포착하고 있다.

Codex 제품군 전반 업데이트

Codex CLI 재설계와 오픈소스화

에이전틱 워크플로에 맞춰 CLI를 재구성해 와이어프레임·스크린샷 첨부, 컨텍스트 공유, 내장 할 일 관리가 가능하다. 승인 모드가 단순해지고 도구 호출·diff 포맷이 개선됐으며 장시간 세션을 지원한다. CLI는 오픈소스로 공개되어 팀이 모델-개발 환경 하네스를 점검·확장할 수 있다.

IDE 확장과 컨텍스트 유지

VS Code, Cursor 등에서 로컬 변경 미리보기와 인라인 코드 편집을 제공한다. 클라우드와 로컬 간 작업 전환 시 컨텍스트를 유지해 협업이 매끄럽다. 현재 Codex를 사용하는 가장 인기 있는 방식으로 자리 잡았다.

클라우드 에이전트의 인프라 개선

백엔드 인프라 최적화로 중간 완료 시간이 90% 단축됐다. 에이전트는 환경을 자동 구성하고 의존성을 설치하며, UI 작업을 위해 브라우저를 띄워 진행 상황을 점검하고 스크린샷을 PR에 첨부한다. GPT-5-Codex 출시와 함께 웹 작업 내에서 자체 스크린샷을 직접 출력해, 로컬 실행 없이도 결과를 시각적으로 확인할 수 있다.

자동 코드 리뷰 워크플로

GitHub 저장소에서 활성화하면 PR 진행에 맞춰 자동 리뷰를 수행하고, 동일 스레드에서 제안 수정안을 직접 반영한다. 보안 취약점 점검 같은 특화 리뷰도 요청 가능하다. 정적 분석기와 달리 코드베이스 전체 복사본을 토대로 의존성을 추론하고 테스트를 돌린 후 피드백을 제공한다.

개발자 경험과 내부 적용

현업 사례와 품질 지표

듀오링고는 백엔드 코드 리뷰 벤치마크에서 타 도구 대비 호환성 이슈와 버그를 더 잘 잡아냈다고 평가했다. 버진 애틀랜틱은 PR 코멘트만 남기면 깔끔한 업데이트가 즉시 생성돼 피드백 왕복이 줄었다고 밝혔다. 시스코 메라키는 타 팀 코드베이스의 복잡한 리팩터링을 자동화해 핵심 업무에 집중할 수 있었고, 여러 기업이 백그라운드 태스크 처리와 깨끗한 diff 제공으로 몰입도를 높였다고 전했다. 내부적으로도 보안·프론트엔드·인프라 전반에 동료처럼 활용되며 최근 한 달 새 사용량이 10배 증가했다.

보안, 통제, 거버넌스

샌드박스 실행과 권한 부여

클라우드와 로컬 모두 기본적으로 네트워크 접근이 비활성화된 샌드박스에서 동작한다. 필요 시 웹 검색이나 외부 도구 연결 권한을 부여할 수 있으나, 배포 전 결과 검토가 권장된다. 모든 작업에는 로그·테스트 결과·출처가 첨부되어 검증을 돕는다. 생물학·화학 등 민감 영역에서는 고성능 모델로 분류해 안전장치를 적용하며, 사람 리뷰를 대체하기보다 추가적인 검증 계층으로 유지할 것을 권고한다.

가격과 제공 방식

ChatGPT 유료 플랜에 포함

Plus(월 20달러), Pro(월 200달러), Business(월 25달러), Edu/Enterprise(문의) 플랜에 번들된다. 등급별로 사용 한도가 상이하며, Plus·Edu·Business는 주간 제한된 집중 세션을, Pro는 다중 프로젝트 전 주간 개발을 지원한다. 엔터프라이즈는 팀 공유 크레딧 풀을 제공하며, 사용 한도 가시성을 높이기 위한 지표 개선이 예고됐다.