leangnews

Command Palette
Search for a command to run...

2026년 02월 11일 09:02

OpenAI, Responses API 업그레이드… 스킬·호스티드 셸·컴팩션

기사 요약

OpenAI가 Responses API에 서버사이드 컴팩션, 호스티드 셸 컨테이너, 표준화된 스킬을 도입해 장기 실행형 에이전트의 한계를 줄였다.
컴팩션은 수백만 토큰과 수백 회 도구 호출에도 문맥을 유지하며, 셸 컨테이너는 Debian 12·/mnt/data·네트워킹으로 완전한 실행 환경을 제공한다.
표준 SKILL.md를 매개로 생태계가 호환·확장되며, 기업은 OpenAI의 상태 유지형 런타임과 Anthropic의 전문 지식 마켓 간에서 요구에 맞춰 선택하면 된다.

에이전트의 한계를 넘기 위한 OpenAI Responses API 업그레이드

그동안 AI 에이전트를 만드는 일은 '30초 기억력'을 가진 장거리 주자를 훈련시키는 것과 비슷했다. 도구와 지시를 주어도 대화가 길어질수록 맥락이 흐트러지고 환각이 늘어났다. OpenAI는 최신 OpenAI Responses API 업데이트로 서버사이드 컴팩션, 호스티드 셸 컨테이너, 그리고 새로운 스킬 표준을 도입하며 이 한계를 정면 돌파한다. 요약하면, 에이전트에게는 고정된 책상, 터미널, 그리고 사라지지 않는 메모리가 생겼다.

기술 핵심: '문맥 건망증'을 다루는 서버사이드 컴팩션

자율형 에이전트의 최대 난제는 장시간 작업 중 누적되는 히스토리다. 도구 호출과 스크립트 실행이 거듭될수록 토큰 한도에 걸려 중요한 추론이 잘려나가곤 했다. 컴팩션은 단순 절단이 아니라, 에이전트가 자신의 과거 행동을 요약해 필수 맥락만 남기는 방식이다. 이로써 작업은 수시간에서 수일에 걸쳐 이어질 수 있다. 이커머스 플랫폼 트리플 웨일의 에이전트 '모비'는 500만 토큰, 150회 도구 호출 세션을 정확도 저하 없이 통과했다. 결과적으로 모델은 '금세 잊는 도우미'에서 '지속 프로세스'로 변모한다.

관리형 클라우드 샌드박스: Shell Tool과 컨테이너

OpenAI Responses API의 Hosted Shell Containers

Shell Tool 도입으로 OpenAI는 관리형 컴퓨팅의 문을 열었다. 개발자는 container_auto 옵션을 통해 OpenAI가 호스팅하는 Debian 12 환경을 즉시 할당받을 수 있다. 이는 단순 코드 인터프리터를 넘어, 각 에이전트에 다음이 사전 구성된 완전한 터미널을 제공한다: Python 3.11, Node.js 22, Java 17, Go 1.23, Ruby 3.1 등의 네이티브 실행 환경, /mnt/data를 통한 지속 스토리지(산출물 생성·저장·다운로드 가능), 서드파티 API 및 라이브러리 설치를 위한 네트워킹.

데이터 엔지니어링을 위한 운영 간소화

호스티드 셸과 /mnt/data 영속 스토리지는 팀이 프로젝트마다 맞춤 ETL 미들웨어를 만들지 않고도 Python이나 Java로 복잡한 변환을 수행하게 한다. 맞춤 인프라를 직접 구축·보안 강화하는 부담을 덜어, 데이터 엔지니어는 고성능 처리에 집중할 수 있다. 메시지는 분명하다: '지침만 주면 컴퓨터는 우리가 제공한다.'

스킬 표준화: 휴대 가능한 절차 지식

OpenAI와 Anthropic은 에이전트가 특정 작업을 수행하도록 지시하는 '스킬'을 공통 표준으로 채택했다. 핵심은 YAML 프런트매터를 포함한 SKILL.md 매니페스트다. 이 표준을 따르면 VS Code나 Cursor 등 다른 플랫폼으로도 이식이 가능하다. 오픈소스 에이전트 OpenClaw는 동일한 SKILL.md와 폴더 패키징을 채택해, 원래 Claude용으로 설계된 전문 절차 지식을 즉시 흡수했다. 이 호환성은 커뮤니티 주도의 '스킬 붐'을 촉발했고, ClawHub에는 스마트홈 연동부터 엔터프라이즈 자동화까지 3천 개가 넘는 확장 기능이 올라왔다. OpenClaw가 OpenAI의 GPT-5 시리즈와 로컬 Llama 등 복수 모델을 지원하기 때문에 개발자는 스킬을 한 번 만들고 다양한 에이전트에 배포할 수 있다.

전략 분기: 개발 속도 vs. 전문성 마켓

OpenAI Responses API의 턴키 '프로그래머블 서브스트레이트'

OpenAI는 셸·메모리·스킬을 Responses API에 묶어 빠르게 복잡한 에이전트를 만들 수 있는 턴키 경험을 제공한다. Glean은 OpenAI 스킬 프레임워크 적용 후 도구 정밀도가 73%에서 85%로 뛰었다. 표준 스킬을 자체 런타임에 결합해, 관리형 Debian 12 셸에서의 호스팅, 네트워킹 정책 적용, 서버사이드 컴팩션을 포괄 지원한다. 장기 실행이 필요한 자율형 워커를 별도 실행 환경 없이 배포하려는 엔지니어에게 '고성능' 선택지다.

Anthropic의 '전문성 마켓플레이스'

Anthropic은 Atlassian, Figma, Stripe 등 파트너 플레이북 디렉터리에서 강점을 보인다. 표준의 점진적 공개를 지원하면서도, 라이브러리급 효율에 최적화해 오케스트레이터가 성숙한 패키지형 전문 지식을 바로 활용하도록 돕는다.

엔터프라이즈 시사점

신속 배포와 미세조정이 필요한 엔지니어에게 서버사이드 컴팩션과 스킬의 조합은 생산성을 크게 끌어올린다. 각 에이전트 런마다 상태 관리 로직을 새로 짜지 않고도 수시간 작업을 소화할 수 있고, 스킬은 미세조정이나 절차 지식을 '패키지형 IP'로 만들어 사내 프로젝트 간 재사용을 가능하게 한다. 채팅 박스 수준을 넘어 프로덕션 워크플로로 AI를 옮기는 데서 맞춤 인프라의 시대는 저문 셈이다. 이제 과제는 '터미널을 줄 것인가'가 아니라 '어떤 스킬을 누구에게 허가할 것인가', '호스티드 파일시스템 산출물을 어떻게 감시·감사할 것인가'로 이동했다.

보안 고려사항

에이전트에 셸과 네트워크를 열어주는 일은 보안상 큰 전환이다. OpenAI는 도메인 시크릿과 조직 허용 리스트로 모델 컨텍스트에 원시 자격 증명이 노출되지 않도록 심층 방어를 제공한다. 동시에 스킬 배포가 쉬워질수록, 프롬프트 인젝션이나 무단 데이터 유출 경로를 만들 수 있는 악성 스킬에 대한 경계가 필수다.

선택 가이드: 어떤 플랫폼이 맞는가

에이전트가 무거운 상태 유지 실행을 요구한다면 OpenAI Responses API가 적합하다. 범용 스킬 표준을 서버사이드 컴팩션과 호스티드 셸 컨테이너와 결합해, 500만+ 토큰 또는 150+ 도구 호출 세션도 자체 메모리 관리나 샌드박스 구축 없이 감당한다. 반대로 모듈형 전문성과 생태계 깊이를 우선한다면 Anthropic의 API가 유리하다. 업계는 agentskills.io 표준화로 '프롬프트 스파게티'를 버리고, 공유·버전 관리·확장 가능한 비즈니스 아키텍처로 이동하고 있다. 어떤 길을 택하든, 기업의 '에이전틱 지식'은 이제 영속적이고 상호운용 가능한 자산이 된다.

정리 및 업데이트

OpenAI는 더 이상 '두뇌(모델)'만이 아니라 '사무실(컨테이너)', '메모리(컴팩션)', '훈련 매뉴얼(스킬)'까지 제공한다. OpenAI Responses API를 중심으로 한 이 전환은 장기 실행형 디지털 워커의 실용화를 가속한다. 2월 10일 오후 6시 52분(ET) 업데이트: OpenAI 스킬의 이식성 관련 오류를 바로잡았다.

최신기사

관찰 메모리, 에이전트 비용 10배 절감…장문 맥락서 RAG 앞서

Datarails, ERP 통합 ‘Spend Control’로 CFO 가시성·좀비 구독 차단

Gather AI, 시리즈B 4천만달러 유치…물류 Physical AI 플랫폼 확장

AI GPU 병목의 본질: 하드웨어가 아닌 데이터 전달 계층 문제

에이전트 연결을 넘어: 진정한 협업과 집단지성의 누락된 계층

300ms에 결론 내리는 사기 탐지 모델이 AI 빌더에게 주는 교훈

엔비디아, 4.4만 시간 인간 영상으로 학습한 로봇 ‘DreamDojo’ 공개

OpenAI Codex 앱, 출시 첫 주 100만+ 다운로드… 무료·Go 제한 예고

멈추지 않는 혁신: TrackingTime이 시간 추적을 올인원 생산성 스위트로