leangnews

2025년 11월 14일 10:02

Deductive AI, 강화학습 디버깅 에이전트로 DoorDash 1,000시간 절감

Deductive AI, 강화학습 디버깅 에이전트로 DoorDash 1,000시간 절감


기사 요약

  • 소프트웨어 복잡도와 AI 코드 생성 확산으로 디버깅 시간이 폭증하자, 강화학습 기반 에이전트를 내세운 Deductive가 생산장애 원인 규명을 ‘분 단위’로 단축했다.
  • CRV 등으로부터 750만 달러 시드 투자를 받은 이 회사는 지식 그래프와 멀티 에이전트, 코드 인지 추론으로 기존 관찰가능성 도구의 빈틈을 메운다.
  • DoorDash와 Foursquare는 각각 연간 1,000시간 이상 생산성 향상·수백만 달러 매출 보호와 90% 진단시간 단축·27만5천 달러 비용 절감을 입증했다.

개요

소프트웨어가 복잡해지고 AI 도구가 코드를 폭발적으로 생성하면서, 엔지니어들은 새로운 기능 개발보다 장애 원인 추적과 디버깅에 최대 절반의 시간을 쓰고 있다. 관찰가능성(Observability) 도구는 “무엇이 깨졌는지”는 보여주지만, “왜 그런지”는 알려주지 못한다. 이런 간극을 메우기 위해 강화학습과 멀티 에이전트를 결합한 새로운 범주의 도구가 등장하고 있다. 특히 ‘바이브 코딩’(자연어 프롬프트로 코드를 생성하는 방식) 확산은 중복, 아키텍처 경계 파손, 암묵적 가정 같은 품질 문제를 누적시켜 디버깅 부담을 키우고 있다. ACM은 개발자의 35~50%가 검증·디버깅에 쓰인다고 보고했고, Harness는 67%가 AI 생성 코드 디버깅 시간이 늘었다고 밝혔다.

Deductive AI가 해결하려는 문제

프로덕션 장애는 새벽 3시에라도 발생한다. 로그·메트릭·배포 이력·코드 변경을 수십 개 서비스에 걸쳐 대조해야 하는 수사 과정은 ‘불타는 초대형 건초 더미에서 바늘 찾기’에 가깝다. Deductive는 이런 현실을 전제로, 수 분 내에 가설을 세우고 근거를 교차검증해 근본원인에 수렴하는 자동화된 조사 흐름을 제시한다.

Deductive AI의 기술 접근법

지식 그래프와 멀티 에이전트 조사

시스템은 코드베이스, 텔레메트리, 엔지니어링 대화, 내부 문서를 아우르는 지식 그래프를 지속 구축·갱신한다. 경보가 발생하면 서로 다른 전문성을 지닌 에이전트들이 최근 코드 변경, 트레이스, 배포 타이밍 등을 분담 분석하며 가설을 형성·검증한다. 이는 숙련된 SRE의 사고 과정을 모사하되, 실행 속도는 ‘분 단위’다.

강화학습으로 사고방식까지 학습

일부 관찰가능성 플랫폼의 LLM 기능이 상관관계 요약에 머무는 반면, 이 시스템은 ‘코드-인지 추론’에 초점을 둔다. 규칙 기반 자동화와 달리, 어떤 조사 단계·데이터 소스·의사결정이 정확한 진단으로 이어졌는지 사건마다 보상 신호로 학습한다. 엔지니어 피드백도 반영해, 단순 지적을 넘어 ‘문제를 어떻게 생각하며 풀 것인가’를 배워간다.

코드-인지 통합과 연결성

관찰가능성 도구, 코드 저장소, 인시던트 관리, 채팅 시스템에 읽기 전용 API로 연결해 서비스 간 의존성과 배포 이력을 시계열로 맵핑한다. 팀·서비스별로 도구가 분화된 대기업 환경에서도 단일한 행동·장애·복구 맥락을 재구성한다.

실제 적용 예시

DoorDash: 10분 내 장애 원인 규명 목표

실시간 광고 경매(100ms 이내 처리) 플랫폼은 인시던트 대응 워크플로에 통합했다. 겉으론 특정 API 지연처럼 보였던 사건에서, 다운스트림 ML 플랫폼 배포로 인한 타임아웃이 진짜 원인임을 로그·트레이스·배포 메타데이터 상관분석으로 규명했다. 수개월간 약 100건의 프로덕션 사건을 근본원인으로 연결해 연간 1,000시간 이상의 엔지니어링 생산성과 ‘수백만 달러’ 매출 보호 효과를 냈으며, 2026년까지 ‘10분 내 해결’ 목표를 세웠다.

Foursquare: Spark 장애 진단 90% 단축

Apache Spark 잡 실패 진단 시간이 시간·일 단위에서 10분 미만으로 줄며 90% 단축을 달성했고, 연간 27만5천 달러 이상 비용을 절감했다.

Deductive AI의 운영 모델과 보안

관찰가능성 스택 위의 보완 레이어

Datadog·New Relic·PagerDuty 등과 경쟁하기보다 그 위에 얹히는 레이어로 포지셔닝한다. 데이터 볼륨이 아니라 ‘조사한 인시던트 수’ 기준으로 과금하며, 기본 플랫폼 요금이 추가된다.

배포 옵션과 데이터 정책

클라우드 호스팅과 자체 호스팅을 모두 제공한다. 고객 데이터를 서버에 저장하지 않고, 다른 고객 모델 학습에 사용하지 않는다고 강조한다. 연결은 읽기 전용으로 이뤄져 운영 안전성을 높인다.

투자와 팀 배경

시드 라운드 750만 달러는 CRV가 주도하고 Databricks Ventures, Thomvest Ventures, PrimeSet가 참여했다. 엔젤로는 Databricks·Anyscale의 창업자 아이온 스토이카, Nutanix·ThoughtSpot의 아지트 싱, Lightstep의 벤 시겔만이 이름을 올렸다. 공동창업자 사미르 아가르월은 UC 버클리 박사로 BlinkDB를 만들고 Databricks 초기 멤버로 Apache Spark 개발에 참여했으며, 라케시 코타리는 ThoughtSpot에서 분산 질의 처리와 대규모 최적화를 이끌었다.

앞으로의 로드맵

사람-검토 루프 유지, 점진적 자동화

이론적으로는 즉시 수정 배포까지 가능하지만, 현재는 엔지니어가 검토·검증·적용할 수 있는 정밀한 수정안과 완화책을 제안하는 수준으로 운용한다. 신뢰·투명성·운영 안전을 위해 인간 검토 루프를 유지하되, 장기적으로는 자동화 범위를 넓힐 계획이다.

사후 대응에서 사전 예방으로

신규 자금과 DoorDash·Foursquare·Kumo AI 등 초기 고객을 바탕으로, 사후 인시던트 분석을 넘어 예측·예방으로 추론 능력을 확장한다. 수동·장시간 조사를 자동화해 엔지니어가 예방, 비즈니스 임팩트, 혁신에 더 많은 시간을 쓰도록 돕는 것이 목표다.

이 기사 공유하기