leangnews
Command Palette
Search for a command to run...
2025년 10월 10일 00:00
노션, 버전 3.0서 에이전트형 AI 확장 위해 기술 스택 전면 재구축
기사 요약
- 노션은 버전 3.0에서 기업 규모의 에이전트형 AI를 위해 기술 스택을 바닥부터 재구축했다.
- 단단한 프롬프트 흐름을 통합 오케스트레이션으로 바꾸고, 모듈식 서브에이전트가 도구를 스스로 선택·연결·동시 실행한다.
- 평가 이원화로 환각을 줄이고, 맥락적 지연시간을 최적화하며, 도그푸딩과 디자인 파트너로 빠른 개선 사이클을 유지한다.
에이전트형 AI 확장을 위한 노션의 전면 재구축
많은 조직이 기술 스택을 갈아엎는 데 주저하지만, 노션은 생산성 소프트웨어 3.0 출시를 앞두고 에이전트형 AI를 엔터프라이즈 규모로 운용하기 위해 아키텍처를 아예 새로 설계했다. 현재 노션은 포브스 AI 50 기업의 94%가 도입했고, 총 사용자 1억 명을 보유하며 OpenAI, Cursor, Figma, Ramp, Vercel 등을 고객으로 둔다.
워크플로우에서 AI 에이전트로: 아키텍처 재오케스트레이션
기존의 퓨샷 기반 단계 지시형 워크플로우를 벗어나, 노션은 단일 오케스트레이션 모델로 재구성했다. 이 코어 모델은 노션과 웹을 검색하고, 데이터베이스를 조회·추가하며, 콘텐츠를 편집하는 모듈식 서브에이전트로 보강된다. 각 에이전트는 상황에 맞게 도구를 스스로 선택해 노션 내부나 슬랙 등 외부에서 연쇄 검색을 수행하고, 필요한 정보를 찾으면 회의 노트를 제안서로 변환하고, 후속 메시지를 생성하며, 태스크를 추적하고, 지식베이스를 찾아 업데이트한다. 2.0이 특정 태스크 수행에 초점을 맞췄다면, 3.0에서는 사용자가 에이전트에게 목표를 할당하면 에이전트가 자율적으로 다중 태스크를 병행 실행한다. 사고의 연쇄(CoT) 지시 학습과 도구 사용 학습 능력이 향상되면서 AI 에이전트의 독립성이 크게 높아졌다.
평가 이원화와 단순화로 환각 최소화
노션은 “더 빠르고, 더 정확하며, 더 저렴하게”라는 원칙 아래 벡터 임베딩 미세조정과 엘라스틱서치 최적화로 지연시간과 정확도를 균형 있게 개선한다. 결정론적 테스트, 도메인 표현(vernacular) 최적화, 휴먼 라벨링, LLM 심사관(LLMs-as-a-judge)을 결합한 엄격한 평가 프레임워크를 운영하며, 모델 기반 스코어링으로 불일치와 오류를 식별한다. 평가를 이원화(bifurcation)하여 문제의 근원을 가르는 방식은 불필요한 환각을 효과적으로 격리한다. 더 단순한 아키텍처는 모델·기법의 진화를 빠르게 반영할 수 있게 하고, 지연시간과 병렬 사고를 최적으로 조율해 정확도를 한층 끌어올린다. 모델은 웹과 노션의 커넥티드 워크스페이스 데이터에 근거해 작동한다.
맥락적 지연시간 이해: 에이전트형 AI의 속도·정확도 균형
지연시간은 본질적으로 맥락 의존적이다. 순수 탐색형 질의(예: 간단한 산술)에는 즉답성이 중요하지만, 에이전트형 AI가 수백 개의 웹사이트와 파일을 가로지르는 20분 규모의 자율 작업을 수행할 때는 사용자가 배경 실행을 용인한다. 핵심은 UI에서 기대치를 명확히 설정하고, 사용 사례별로 “얼마나 느려도 이탈하지 않는가”를 실험·검증해, 속도와 완결성 사이의 최적점을 찾는 일이다.
노션의 도그푸딩과 디자인 파트너 협업
노션은 사내 샌드박스로 학습·평가 데이터를 지속 생성하고, 엄격한 엄지 올림/내림 피드백 루프를 운용한다. 사용자가 ‘내림’을 누르면 개인정보 비식별 해제 범위를 명시적으로 허용한 것으로 간주해 휴먼 어노테이터가 상호작용을 분석한다. 자사 제품에 대한 ‘착시’를 경계하기 위해, 노션은 AI에 정통한 신뢰할 수 있는 디자인 파트너에게 신기능을 조기 공개해 외부 피드백을 병행 수집한다. 또한 회귀(regression)를 방지하기 위한 상시 내부 테스트로 품질과 지연시간의 가드레일을 유지하고, 회고형 평가와 전향적 개발 지표(관측·회귀 방증 평가)를 구분해 의사결정의 리트머스 시험지로 활용한다.
엔터프라이즈를 위한 시사점: 에이전트형 AI 운영화
기반 역량이 바뀌면 과감히 재구축하라—노션은 추론 중심 모델에 맞춰 전면 재설계를 단행했다. 지연시간은 보편 최적화가 아니라 용례별 최적화 대상이다. 모든 출력을 신뢰할 수 있는 큐레이션된 엔터프라이즈 데이터에 근거시키고, 어려운 결정을 주저하지 말라. 에이전트형 AI를 도입하는 기업은 이러한 원칙을 바탕으로 연결되고 권한이 부여된 워크스페이스에서 안전하고 역동적으로 운영화를 추진할 수 있다.