시간당 900달러 엔지니어, PromptQL의 AI 컨설팅이 빅4를 겨냥한다

시간당 900달러 엔지니어, PromptQL의 AI 컨설팅이 빅4를 겨냥한다

시간당 900달러 엔지니어, PromptQL의 AI 컨설팅이 빅4를 겨냥한다


기사 요약

  • 기업가치 10억 달러 이상인 PromptQL이 시간당 900달러로 자사 AI 엔지니어를 투입하는 컨설팅을 출시해, 전략만 제시하던 전통 컨설팅과의 판도를 흔들고 있다.
  • 이 서비스는 MIT가 지적한 엔터프라이즈 AI 95% 실패율을 겨냥해 불확실성 신호, 피드백 학습, 정량 평가(GATs)로 ROI를 검증 가능하게 만든다.
  • 베타 단계임에도 포춘 500과 7자리 계약, 페타바이트급 데이터 처리, 2.5만 사용자 배포를 성사시키며 신뢰 가능한 AI 전환 수요를 입증했다.

포춘 500 겨냥한 시간당 900달러 AI 엔지니어 컨설팅

기업가치가 10억 달러를 넘는 PromptQL은 시간당 900달러에 자사 AI 엔지니어가 의사결정자와 직접 일하는 “AI 투자 진단(AI Investment Assessment)”을 내놓았다. 3년 만에 두 개의 10억 달러대 제품을 만든 실제 개발자가 투입되는 점이 특징으로, 공급자-고객 구도를 넘어 기술 공급자이자 전략 자문역을 겸한다. 공동창업자 탄마이 고팔은 “많은 데이터 리더가 정확도와 사용률은 재지 않고, 데이터 중앙화 같은 준비 지표만 본다”며 실사용 성과 측정의 부재를 꼬집었다.

엔터프라이즈 AI가 ‘자신감 있게 틀리는’ 이유

검증 비용과 생산성 역설

많은 기업용 AI가 확신에 차 틀린 답을 내놓는 ‘confidently wrong’ 문제를 드러냈다. 이로 인해 사용자는 매 응답을 사실검증해야 하는 ‘검증세(verification tax)’를 치르고, 약속된 생산성 향상은 사라진다. 핵심 과제는 정답 생성 자체보다, 틀릴 때 틀렸다고 신호 보내지 못하는 데 있다.

불확실성 신호와 피드백 학습

이 회사는 AI가 불확실성을 명시하고 사용자 피드백으로 학습하도록 설계해 환각을 줄였다. 이러한 접근으로 분석·자동화 영역에서 기업 고객에게 사실상 완벽에 가까운 정확도를 달성했다고 주장한다. PromptQL의 차별점은 답을 그럴듯하게 꾸미는 대신, 근거와 한계를 드러내며 점진적으로 성능을 높이는 운영 방식에 있다.

Hasura에서 출발해 기업용 AI 플랫폼으로

오픈소스 성장 스토리

팀은 오픈소스 데이터 액세스 플랫폼 하수라(Hasura)에서 출발했다. 라이트스피드, 그리노크스, 버텍스, 넥서스 등으로부터 투자를 받았고, 그래프QL 엔진은 누적 10억 회 이상 다운로드되며 포춘 100의 절반이 활용했다. 초기 폭발적 성장 경험이 ‘엔터프라이즈 데이터에 정확히 접근하고 추론하는 AI’라는 다음 과제를 향하게 했다.

AI가 데이터를 대신 읽는 미래

2년 전 구글 서치·MSR·인튜잇 리서치 출신을 모아 연구를 본격화했으며, 범용 도구의 한계를 마주한 기업 수요가 그 타이밍을 뒷받침했다. 이들은 “앞으로는 앱이 아니라, 사용자를 대신해 데이터와 대화하는 AI”가 주역이 될 것이라 본다.

포춘 500과의 7자리 계약이 말하는 수요

베타 단계에서도 대규모 배치

공개 전환을 기다리는 법적 절차로 고객사는 비공개지만, 세계 최대 네트워킹 기업(연매출 500~600억 달러대), 세계 최대 패스트푸드 체인, 글로벌 2대 식료품 배달 플랫폼 등과 수개월 내 7자리 계약을 다수 체결했다. 거래량이 큰 고객의 경우 페타바이트에 가까운 데이터를 처리하고, 대형 영업조직에서는 인수합병으로 늘어난 계열사를 포함해 2만5천 명 규모로 배포했다.

아키텍처로 푸는 핵심 기술 과제

에이전틱 시맨틱 레이어(부서별 맥락·암묵지 포착)

부서·지역·시점별로 변하는 비즈니스 맥락과 직원 머릿속에만 있던 ‘부족 지식(tribal knowledge)’까지 모델이 흡수하도록 설계해, 운영 중 축적되는 컨텍스트를 잃지 않게 한다.

도메인 특화 언어로 ‘답’이 아닌 ‘계획’ 생성

일괄 생성 대신 기업 전용 DSL로 ‘계획(plan)’을 만든 뒤, 이를 결정론적 액션으로 컴파일한다. 실행 시점 검증과 정책 점검을 거쳐 환각과 권한 오류를 줄인다.

분산 쿼리 엔진과 의도 기반 라우팅

데이터를 한곳에 모으지 않고도 이기종 시스템을 가로질러 조회한다. 모든 질의를 동일 취급하는 RAG 대비, 의도별 라우팅으로 단순 질의는 26~90배 빠르게, 복잡 분석은 정확도를 유지·향상시킨다.

AI 컨설팅 시장의 판도 변화

엔지니어가 전략 자문을 겸하는 모델

맥킨지·딜로이트 등 빅4가 막대한 비용으로 ‘전략’을 제시하는 동안, 현업 도입 성과는 낮다는 비판이 컸다. PromptQL의 시간당 900달러 컨설팅은 생산 환경에 AI를 올린 엔지니어에게 직접 접근하도록 해, 비용은 낮추고 성과는 앞당기는 방식을 표방한다. 초기 고객은 과신형 AI를 신뢰형 대안으로 교체해 ‘수백만 달러 절감’을 보고하고 있다.

95% 실패율을 넘기 위한 평가 체계

GATs로 성능과 비즈니스 임팩트 계량화

MIT 연구에 따르면 기업 AI 파일럿의 95%가 유의미한 ROI를 내지 못한다. 전통 소프트웨어처럼 일회성 구축에 그치고, 지속 학습·피드백 루프와 계량 평가가 부재하기 때문이다. PromptQL은 GATs(GenAI Assessment Tests)로 정확도·불확실성 신호·사용률·업무 지표를 함께 측정한다. 경영진이 스스로 던져야 할 질문은 명확하다. “확신이 없을 때 그 이유를 말해주는가? 내가 방금 준 교정에서 곧바로 학습하는가? 다음 사용자는 같은 함정에 빠지지 않는가?”

전략적 시사점

기술 깊이가 성패를 좌우한다

선도 AI 기업은 이제 단순한 솔루션 판매를 넘어, 구상-설계-배포 전 과정을 동행하는 전략 파트너로 움직이고 있다. 현장 구현에서 얻은 피드백이 제품으로 재투입되며 격차는 더 커진다. ‘지능이 구현을 이긴다’는 오래된 가설과 달리, 코드 한 줄 써보지 않은 컨설턴트보다 시스템을 만든 엔지니어가 비즈니스를 더 잘 이해할 수 있음을 시장이 확인하고 있다.