leangnews
Command Palette
Search for a command to run...
2025년 12월 02일 12:02
Anthropic, 멀티 세션 Claude SDK로 에이전트 메모리 난제 해결
기사 요약
- 기업들이 겪어온 에이전트 메모리 한계를 해결하기 위해 Anthropic이 멀티 세션을 지원하는 Claude Agent SDK 개선안을 공개했다.
- 이니셜라이저 에이전트와 코딩 에이전트로 구성된 두 단계 접근법으로 세션 간 맥락을 잇고 점진적 진행과 산출물 기록을 보장한다.
- 여전히 단일 범용 에이전트 vs 다중 에이전트 구조의 우열과 과업 일반화는 미정으로, 후속 연구와 검증이 요구된다.
장시간 실행에서의 에이전트 메모리 문제와 Anthropic의 해법
엔터프라이즈 환경에서 장시간 실행되는 AI는 컨텍스트 윈도우 제약으로 지시사항을 잊거나 비정상적으로 동작하기 쉽다. Anthropic은 Claude Agent SDK에 멀티 세션 전략을 도입해 이 에이전트 메모리 병목을 줄였다고 밝혔다.
에이전트 메모리 문제의 배경
기반 모델이 구동하는 에이전트는 컨텍스트 윈도우가 제한적이어서 복잡한 작업을 한 번에 끝내기 어렵다. 시간이 지날수록 에이전트 메모리가 희미해지면 이전 대화와 지시가 누락되어 결과 일관성이 떨어진다. 이 문제를 해결하는 것은 비즈니스 안전성과 신뢰성을 위해 핵심 과제가 되었다.
두 단계 구성: 이니셜라이저와 코딩 에이전트
Anthropic은 두 갈래 접근법을 제안했다. 첫째, 이니셜라이저 에이전트가 프로젝트 환경을 설정하고 변경 이력과 생성 파일을 기록한다. 둘째, 코딩 에이전트가 각 세션마다 목표를 향해 작은 단위로 진전시키고, 다음 세션을 위해 구조화된 업데이트와 산출물을 남긴다. 이렇게 하면 세션이 바뀌어도 에이전트 메모리 공백을 최소화할 수 있다.
왜 기존 방식은 실패했나
Anthropic은 Opus 4.5와 Claude Agent SDK 조합에서도 “claude.ai를 복제하라” 같은 포괄적 프롬프트만으론 제작 수준의 웹앱을 끝내지 못하는 경우를 확인했다. 대표적 실패 패턴은 두 가지다. 첫째, 한 번에 너무 많은 일을 하려다 중간에 컨텍스트가 소진되어 다음 세션으로 정확한 지시를 전달하지 못한다. 둘째, 일부 기능이 구현된 뒤 진행 상황을 오판하고 작업 완료를 성급히 선언한다.
작동 원리와 품질 보강
해법은 초기에 기능 토대를 깔고, 매 세션 ‘작게-확실하게’ 전진하면서 종료 시 상태를 깔끔히 정리해 다음 세션이 재현 가능하도록 만드는 것이다. Anthropic은 코딩 에이전트에 테스트 도구를 추가해 코드만으로는 드러나지 않는 결함도 탐지·수정할 수 있게 했다. 이를 통해 Claude Agent SDK는 장시간 실행 상황에서도 보다 안정적으로 맥락을 잇는다.
관련 생태계와 비교
최근 업계는 LangChain의 LangMem, Memobase, OpenAI의 Swarm 등 다양한 메모리 프레임워크를 내놓고 있으며, Google의 Nested Learning Paradigm과 Memp 같은 연구도 등장했다. 다수는 오픈소스로, 여러 LLM에 적용 가능하다. Anthropic의 접근은 Claude Agent SDK에 최적화되어 있으나 원리는 일반적 메모리 전략과 상호보완적이다.
한계와 향후 연구
Anthropic은 이번 방법이 장시간 에이전트 프레임워크 중 하나의 해법일 뿐이라고 선을 그었다. 단일 범용 코딩 에이전트가 모든 맥락에서 최선인지, 역할을 나눈 다중 에이전트가 더 효율적인지는 아직 불분명하다. 또한 시연은 풀스택 웹앱 개발에 초점을 뒀으므로, 과학 연구나 금융 모델링처럼 다른 장시간 과업으로 일반화하는 검증이 필요하다.