leangnews

2025년 11월 12일 09:00

Qodo와 monday.com이 증명한 컨텍스트 엔지니어링의 리뷰 혁신

Qodo와 monday.com이 증명한 컨텍스트 엔지니어링의 리뷰 혁신


기사 요약

  • monday.com은 Qodo를 도입해 매월 800건 넘는 이슈의 프로덕션 유입을 막고 보안 취약점까지 사전에 차단했다.
  • Qodo는 코드 생성 대신 리뷰에 특화되어 컨텍스트 엔지니어링으로 코드 변경의 의도·비즈니스 로직·사내 규범까지 학습해 팀별 맞춤 피드백을 제시한다.
  • GitHub 액션으로 자연스럽게 통합되어 PR당 약 1시간을 절감했고, Qodo Gen·Merge·Cover와 Vertex AI 연동, 프리미엄(freemium) 모델로 제품군을 확장 중이다.

컨텍스트 엔지니어링이 AI ‘바이브 코드’ 과부하를 막는 법

프로젝트 추적 플랫폼 monday.com의 엔지니어링 조직이 500명 이상으로 커지자, 제품 라인과 마이크로서비스가 폭발적으로 늘며 코드 리뷰 병목이 심해졌다. 월 수천 건의 PR을 지루함 없이, 품질 저하 없이 검토할 방법이 필요했고, 성장·Monday Dev 팀을 이끄는 가이 레제브는 개발자 에이전트에 특화된 이스라엘 스타트업 Qodo의 AI 리뷰 도구를 시험했다. 가벼운 테스트로 시작된 도입은 곧 배포 인프라의 핵심이 되었고, 레제브는 “Qodo는 그냥 또 하나의 도구가 아니라 우리 방식으로 일하는 법을 배우는 새로운 팀원 같다”며 “매월 800건 이상의 이슈가 프로덕션으로 나가는 것을 막았고, 그중엔 심각한 보안 취약점이 될 뻔한 것도 있었다”고 말했다.

규모 확장과 코드 리뷰의 병목

monday.com 개발팀은 언제나 수백 개 레포지토리와 서비스에 업데이트를 배포한다. 마케팅, CRM, 개발 도구, 내부 플랫폼 등 제품 영역별로 팀이 촘촘히 맞물려 일한다. Qodo는 코드 생성 도구가 아니라 리뷰 도구로, PR에서 무엇이 바뀌었는지뿐 아니라 왜 바뀌었는지, 비즈니스 로직과 내부 베스트 프랙티스에 부합하는지까지 평가한다. Qodo의 공동창업자 이타마르 프리드먼은 “다른 도구로 5분 만에 1,000줄 코드를 만들 수 있지만, 40분 안에 그걸 리뷰하긴 어렵다. 그래서 실제로 리뷰해주는 Qodo가 필요하다”고 말했다.

컨텍스트 엔지니어링이란 무엇인가

Qodo의 비결은 컨텍스트 엔지니어링, 즉 모델이 의사결정 시 보는 모든 입력을 시스템 차원에서 설계·관리하는 접근이다. PR의 코드 diff는 물론, 이전 논의와 문서, 관련 소스 파일, 테스트 결과와 설정 데이터까지 묶어 제공한다. 언어모델은 입력에 기반해 다음 토큰을 예측하므로, 출력 품질은 입력의 구조와 선별에 좌우된다. Qodo 커뮤니티 매니저 다나 파인은 “고정된 토큰 한도 안에서 구조화된 입력을 설계하는 일”이라고 표현했다. 이 덕분에 Qodo는 하드코딩된 변수, 누락된 폴백, 조직 간 아키텍처 규범 위반처럼 사람도 놓치기 쉬운 미묘한 결함을 짚어낸다. 실제로 최근 한 PR에서 스테이징 환경 변수를 노출할 뻔한 라인을 Qodo가 찾아냈고, 레제브는 “그 보안 이슈를 수습하는 데 들 시간과 법적 리스크를 생각하면, PR 단에서 줄인 시간이 훨씬 값진 절감”이라고 말했다.

사례: 스테이징 변수 노출을 사전에 차단

인간 리뷰어들이 지나친 변경 라인 하나를 Qodo가 지적하며 위험을 경고했다. 병합됐다면 프로덕션 장애와 보안 사고로 이어질 수 있는 변경이었고, 팀은 즉시 수정해 위험을 제거했다.

파이프라인 통합과 인간-검토 루프

현재 Qodo는 monday.com의 워크플로에 깊이 녹아 PR을 분석하고 과거 리뷰 이력에 비춰 맥락 인지형 권고를 제시한다. 개발자는 제안을 참고하되 최종 결정권을 유지하는 인간-검토 루프가 핵심 채택 요인이었다. GitHub의 PR 액션·코멘트로 바로 통합되어 별도 학습 곡선도 낮았다. 레제브는 “그냥 GitHub 액션일 뿐”이라며, 프리드먼은 “개발자가 코드를 이해하고, 오너십을 갖고, 서로 피드백하며 표준을 세우도록 돕는 것이 목적”이라고 설명했다. 이 과정 전반에 컨텍스트 엔지니어링 기반 리뷰가 적용된다.

가시적 성과: 시간 절감과 품질 향상

확대 도입 이후 내부 분석에 따르면 개발자는 PR당 평균 약 1시간을 절감했다. 월 수천 건의 PR에 곱하면 연간 수천 시간의 생산성이 확보된다. 제안 사항은 단순 스타일이 아니라 비즈니스 로직, 보안, 런타임 안정성과 직결된 내용이 많고, 조직의 실제 규범을 반영하므로 적용률도 높다. 시스템 정확도는 데이터 퍼스트 설계에서 나온다. Qodo는 각 회사의 비공개 코드베이스와 과거 기록을 학습해 팀별 문체와 관행에 적응하며, 범용 규칙이나 외부 데이터셋에 의존하지 않는다.

제품 비전과 로드맵

레제브의 팀은 Qodo와 Monday Dev 간 심화 통합을 추진 중이다. 티켓·업무·고객 피드백 같은 비즈니스 컨텍스트를 리뷰 계층으로 끌어와, 코드가 “작동하는가”를 넘어 “올바른 문제를 풀었는가”까지 평가하려는 구상이다. 한편 Qodo는 리뷰를 넘어 개발자 에이전트 플랫폼을 구축하고 있다. 컨텍스트 인지형 코드 생성의 Qodo Gen, 자동 PR 분석의 Qodo Merge, 런타임 검증으로 회귀를 막는 Qodo Cover가 그것이다. 이들을 떠받치는 Qodo-Embed-1-1.5B 오픈소스 임베딩 모델은 코드 검색 벤치마크에서 OpenAI와 Salesforce 대비 우수한 성능을 보였다.

도입 모델과 다음 단계

Qodo는 개인 무료를 포함한 프리미엄(freemium) 모델을 제공하고, Google Cloud Perks를 통한 스타트업 할인과 SSO·에어갭 배포·고급 통제 등 엔터프라이즈 옵션을 갖췄다. 이미 NVIDIA, Intuit 등 포춘 500 팀과 협업 중이며, Google Cloud와의 파트너십으로 Vertex AI Model Garden에서도 곧바로 사용할 수 있다. 프리드먼은 “2026년의 큰 흐름은 컨텍스트 엔진”이라며, 기업이 진정으로 ‘이해하고 돕는’ AI를 원한다면 자사형 두 번째 두뇌를 구축해야 한다고 말했다. 적재적소에 제공되는 컨텍스트 엔지니어링은 대규모 조직의 빌드·배포·스케일 방식을 근본적으로 바꾸고 있다.

이 기사 공유하기