leangnews

2026년 02월 03일 09:02

OpenAI, 다중 에이전트 병렬 실행 ‘Codex’ macOS 앱 출시

OpenAI, 다중 에이전트 병렬 실행 ‘Codex’ macOS 앱 출시


기사 요약

  • OpenAI가 macOS용 Codex 앱을 공개해 다중 AI 코딩 에이전트를 병렬로 관리·자동화하는 ‘에이전트 지휘센터’를 제시했다.
  • 스킬·오토메이션·워크트리와 샌드박스·세분화된 권한으로 장기 작업과 보안을 강화하고, 내부 사용례로 개발·연구 생산성 향상을 입증했다.
  • 엔터프라이즈 지출 급증과 경쟁 격화 속에 가격은 기존 ChatGPT 구독에 포함되며, Windows 지원·클라우드 트리거·플랜 모드 등 로드맵을 예고했다.

개요: 에이전트 지휘센터로 진화한 Codex 앱

OpenAI가 macOS용 ‘Codex 앱’을 출시했다. 이 도구는 단일 AI 보조와의 페어 코딩을 넘어, 여러 자율 에이전트를 병렬로 배치·감독하는 개발 방식으로의 전환을 목표로 한다. 개발자는 반복 작업을 자동화하고, 최대 30분간 독립 실행되는 에이전트를 관리해 완성된 코드를 수령할 수 있다. 샘 알트만은 이를 ‘가장 사랑받는 내부 제품’이라 평가하며 실제 업무에 큰 변화를 가져왔다고 말했다.

왜 IDE에서 에이전트 관리로 이동하나

기존의 GitHub Copilot 등이 실시간 자동완성에 초점을 맞췄다면, Codex 앱은 다중 에이전트의 병렬 실행과 장기 협업을 전면에 내세운다. 제품 리드 알렉산더 엠비리코스는 Codex(2021)에서 GPT-5, 5.2로 이어진 성능 도약을 배경으로, 개발자들이 ‘라인 보완’에서 ‘기능 단위 위임’으로 전환했다고 설명했다. 알트만은 최근 비교적 큰 프로젝트를 IDE 없이 마쳤다고 밝히며 변화의 속도를 강조했다.

Codex 앱 핵심 기능

스킬(Skills): 팀 선호에 맞춘 신뢰 가능한 자동화

스킬은 지시문·리소스·스크립트를 묶어 Codex가 외부 도구에 안정적으로 연결되고, 워크플로를 실행하며, 팀 규범에 맞춰 작업을 마치도록 돕는다. 전용 UI에서 스킬을 만들고 관리할 수 있으며, 사용자가 특정 스킬을 호출하거나 시스템이 자동 선택하도록 둘 수 있다. Figma 맥락 가져오기, Linear 프로젝트 관리, Cloudflare·Vercel 배포, GPT Image 생성, 문서·스프레드시트·PDF 제작 등 공용 스킬 라이브러리가 제공된다.

오토메이션(Automations)과 워크트리: 병렬 진행의 표준화

오토메이션은 정해진 일정에 Codex가 백그라운드에서 자동으로 일하도록 스케줄링한다. 결과는 검토 큐에 쌓여 필요 시 사람이 이어받는다. OpenAI 내부에서는 이슈 분류, CI 실패 요약, 릴리스 브리프 생성, 버그 점검 등 반복 업무에 활용 중이다. 또한 ‘워크트리’ 지원으로 각 에이전트가 격리된 코드 복사본에서 작업해 충돌 없이 다양한 경로를 탐색할 수 있다. 이러한 조합은 Codex 앱의 병렬성·가시성을 높여준다.

보안과 권한: 샌드박스 중심의 신뢰 설계

Codex 앱은 네이티브·오픈소스·구성 가능한 시스템 수준 샌드박싱을 채택했다. 기본 설정에서 에이전트는 지정 폴더/브랜치 내 파일 편집과 캐시된 웹 검색만 허용되며, 네트워크 접근 등 고권한 명령은 별도 승인을 구한다. 사용자는 ‘특정 동작에 대한 지속 승인’을 설정해 반복 승인의 피로를 줄일 수 있다. 알트만은 사용자가 원하는 통제 수준을 합리적으로 설정할 수 있도록 권한 구조를 설계했다고 설명하면서도, 동일 역량이 악용될 경우 보안 위협을 키울 수 있음을 인정했다.

시장 맥락: 급증하는 엔터프라이즈 지출과 경쟁

a16z가 Global 2000 기업 100곳을 조사한 결과, 78%가 OpenAI 모델을 프로덕션에 사용 중이며, Anthropic·Google이 빠르게 추격하고 있다. 엔터프라이즈 LLM 지출은 2년간 약 4.5백만달러에서 7백만달러로 증가했고, 올해 65% 추가 성장(약 1,160만달러)이 예상된다. 용도별로는 챗봇·지식관리·CS에서 OpenAI가, 소프트웨어 개발·데이터 분석에선 Anthropic이 강세다. 한편 기존 관계를 지닌 Microsoft는 여전히 기업 채택을 주도하지만, 다(多)모델 전략 확산으로 도전자의 기회도 커지고 있다.

차별화 포인트: 장기 작업과 복잡계에서의 성숙도

팀 리드 티보 소티오는 Codex 앱을 장기·병렬 작업에 최적화했다고 강조했다. 알트만은 ‘프런트엔드 분위기 코딩’은 여러 도구가 해내지만, 복잡한 시스템에서 OpenAI 5.2 모델이 여전히 가장 강력하다고 주장했다. Codex 앱은 이러한 모델 역량을 다중 에이전트 UI에 녹여, 병렬 조정 시 길을 잃지 않도록 설계됐다.

생산성의 병목: 사람의 타이핑 속도와 ‘풍요 마인드셋’

엠비리코스는 사람의 타이핑 속도가 과소평가된 생산성 병목이라고 지적했다. Codex 앱은 하나의 요청을 완벽히 다듬기보다, 여러 작업을 동시에 돌려 가장 나은 결과를 고르는 ‘풍요(Abundance) 마인드셋’을 장려한다. 내부 파워 유저는 하루/한 시간에 20개 이상 작업을 병렬로 실행·관리하며, 워크트리 위에서 에이전트가 독립적으로 진척시킨다.

내부 사례: 개발 가속·연구 자동화·기술부채 해소

OpenAI는 Codex 앱으로 4명의 엔지니어가 18일 만에 Sora Android 앱을 내고, 한 달 내 외부 공개까지 이뤘다고 밝혔다. 연구 현장에서는 데이터셋 작성, 스크리닝 런 조사, 회의 중 병렬 검증 등에서 유용성이 입증됐다. 소티오는 ‘항상 인간이 루프에 있다’며 자기 개선 우려를 완화했지만, 알트만은 대규모 인프라 소프트웨어 작성과 새로운 알고리즘 아이디어 도출 모두에서 유망한 신호가 보인다고 말했다. 기술부채 측면에선 리팩터링·테스트 작성 등 사람들이 기피하는 일을 에이전트가 지치지 않고 지속 수행해 품질 관리에 기여한다는 평가다.

가격과 제공 범위

Codex 앱은 macOS에서 오늘부터 사용 가능하며, ChatGPT Plus·Pro·Business·Enterprise·Edu 구독자에게 제공된다(기본 사용량 포함, 추가 크레딧 구매 가능). 프로모션 기간 동안 ChatGPT Free·Go 사용에도 한시적으로 열리며, 기존 유료 플랜의 Codex 사용자는 레이트 리밋이 2배로 상향된다. 최근 한 달 기준 사용자 수는 100만 명을 넘었고, GPT-5.2-Codex 출시 이후 사용량은 거의 두 배로 증가했다. 대기업(예: Cisco, Virgin Atlantic, Duolingo 등)과 스타트업이 함께 채택하고 있으며, 일부 개인 개발자는 생산성이 두 배 가까이 늘었다고 보고했다.

로드맵: Windows, 클라우드 트리거, 플랜 모드

OpenAI는 Codex 앱의 Windows 지원, 더 빠른 추론, 실사용 피드백 기반 다중 에이전트 워크플로 고도화를 예고했다. 클라우드 기반 트리거가 포함된 오토메이션으로 컴퓨터가 꺼져도 백그라운드에서 지속 실행되도록 확장한다. 또한 ‘플랜 모드’로 변경 사항을 읽기 전용으로 먼저 검토·대화한 뒤 실행해 신뢰도를 높이고, 사용자 기호에 맞춘 성격(personality) 커스터마이징과 ChatGPT 계정 연계도 계획 중이다.

의미와 전망: 코드는 범용 인터페이스가 될까

OpenAI는 ‘모든 것은 코드로 제어된다’는 전제를 내세우며, 추론·코드 생성 역량이 높을수록 기술·지식 업무 전반에서 에이전트의 포괄적 유용성이 커진다고 본다. 알트만은 ‘바이브 코딩’을 넘어 진지한 소프트웨어 공학의 주류 방식으로 빠르게 자리 잡을 것이라 내다보면서, 코드를 모든 지식 노동의 범용 인터페이스로 확장하려는 포부를 밝혔다. Codex 앱은 이러한 비전을 향한 현재형 발판이자, 병렬·장기 작업을 일상화하는 실무 도구로 자리매김하고 있다.

정리: Codex 앱의 핵심 가치

Codex 앱은 다중 에이전트 병렬 실행, 스킬·오토메이션·워크트리, 샌드박스·권한 모델을 결합해 ‘속도·안정성·통제’를 동시에 노린다. 엔터프라이즈 도입 경쟁이 치열한 가운데, Codex 앱은 복잡한 시스템에서의 신뢰 가능한 장기 작업을 차별점으로 내세운다. 개발의 미래는 ‘코드를 작성하는 사람’에서 ‘코드를 작성하는 에이전트를 관리하는 사람’으로 옮겨가고 있다.

이 기사 공유하기