오픈AI 1억달러 제휴보다 큰 성과: 데이터브릭스 프롬프트 최적화로 AI 비용 90배 절감

오픈AI 1억달러 제휴보다 큰 성과: 데이터브릭스 프롬프트 최적화로 AI 비용 90배 절감

오픈AI 1억달러 제휴보다 큰 성과: 데이터브릭스 프롬프트 최적화로 AI 비용 90배 절감


데이터브릭스의 프롬프트 최적화 돌파구

기업용 AI에서는 올바른 모델과 프롬프트를 고르는 것만큼이나 프롬프트 최적화가 핵심 과제다. 데이터브릭스는 6월 공개한 에이전트 브릭스(Agent Bricks)에 이를 적용해 꾸준히 고도화해 왔고, 이번에 GEPA(Generative Evolutionary Prompt Adaptation)라는 새 기법을 공개하며 프롬프트 최적화 성능을 한 단계 높였다. 회사는 이 개선으로 모델 운영 비용을 최대 90배까지 낮출 수 있다고 주장한다. 이 돌파구는 오픈AI와의 1억달러 규모 파트너십과 함께 발표됐는데, 이번 금액은 상호 지급이 아니라 파트너십으로 기대되는 매출 규모를 의미한다. 진짜 포인트는 프롬프트 최적화 연구가 ‘프리미엄 가격 없이도 프리미엄 성능’을 가능하게 한다는 점이다.

GEPA로 다시 쓰는 프롬프트 최적화 전략

GEPA는 데이터브릭스와 UC 버클리 연구진이 개발한 기법으로, 전통적인 파인튜닝처럼 가중치를 바꾸는 대신 기업이 AI에 던지는 질문 자체를 최적화한다. 한린 탕 데이터브릭스 신경망 CTO는 “프롬프트 최적화는 기존 질의를 빠르게 실행하는 문제가 아니라, 질의 그 자체를 바꾸는 것”이라며 “같은 사실을 묻는 데도 여러 방식이 있고, LLM에 가장 잘 묻게 하는 방법을 찾는 일”이라고 말했다. GEPA는 AI가 자신의 출력을 비판적으로 검토하고 개선하는 ‘자연어 반성’ 루프를 사용해, 업무별로 최적 프롬프트를 자동 탐색한다. 금융·법률·커머스·헬스케어 전반에서 기준 대비 4~7%p의 지속적인 성능 향상을 입증했다.

프롬프트 최적화의 경제학: 90배 비용 절감

엔터프라이즈 규모에서 효과는 극적이다. 요청 10만 건 기준, 데이터브릭스의 최적화된 오픈소스 모델은 Claude Opus 4.1 대비 1/90 비용으로 더 높은 품질을 낸다. “프롬프트 최적화로 과제별 품질을 끌어올리면, 더 작은 모델을 같은 품질로 맞춰 비용을 절감할 수 있다”는 게 탕의 설명이다. 요청이 1천만 건으로 커지면 일회성 최적화 비용은 서빙 비용 대비 미미해진다. 또한 GEPA는 현행 표준인 지도형 파인튜닝(SFT)보다 성능이 앞서면서 서빙 비용을 20% 줄였고, 엔지니어·데이터 과학자가 ‘정답 프롬프트’를 찾는 데 들이던 시간을 크게 절약한다.

OpenAI 통합과 프롬프트 최적화의 시너지

프롬프트 최적화는 어떤 모델에도 유용하지만, 다수의 고품질 모델을 손쉽게 실험할 수 있을 때 위력이 배가된다. 데이터브릭스–오픈AI 파트너십은 GPT-5를 데이터브릭스에서 네이티브로 제공해 외부 벤더 계약이나 API 키 없이도 바로 질의할 수 있게 했다. 통합은 API 연동을 넘어 SQL에서 직접 GPT-5를 호출해 테이블 행 번역 같은 작업을 수행하도록 지원한다. 이로써 프리미엄 모델 배포의 벤더 관리 복잡성이 사라지고, 앤트로픽·구글 제미니 등과 병행하는 멀티모델 전략도 강화된다.

엔터프라이즈 실행 계획

의사결정권자를 위한 권장 사항은 세 가지다. 첫째, 평가부터 구축하라: 에이전트 브릭스는 과제 맞춤 평가를 제공하므로, 품질을 모른 채 운용하지 말고 먼저 에이전트를 만들고 평가를 정립하라. 둘째, 파인튜닝을 당연시하지 말라: 프롬프트 최적화가 더 낮은 비용으로 SFT에 필적하거나 능가할 수 있으니 두 접근을 비교 평가하라. 셋째, 조달 전략을 재설계하라: 배포 후 최적화 역량을 감안하면, 초기 단가가 낮아도 프론티어급 성능으로 끌어올릴 수 있는 모델이 총소유비용 면에서 더 큰 가치를 줄 수 있다. 결론적으로, 프론티어 AI 성능에 대한 비용 장벽은 무너졌으며, 지금 최적화 역량에 투자하는 초기 adopters가 시간이 지날수록 격차를 벌릴 것이다.

실제 적용 예시

프롬프트 최적화 전 필수 체크리스트

업무 목적과 성공 지표를 명확히 정의하고, 대표 데이터와 금지·민감 정보 정책을 정리한다. 기준선 모델과 평가 세트를 마련해 현재 품질과 비용을 수치화한다. 관찰·로깅 체계를 준비하고, 인프라·예산 한도를 설정해 프롬프트 최적화 실험의 범위를 통제한다.

프롬프트 최적화 도입 프로세스 단계별 안내

1) 데이터와 지표 확정 → 2) 초기 프롬프트 설계 및 베이스라인 측정 → 3) GEPA로 자동 탐색·자연어 반성 루프 적용 → 4) SFT 대비 A/B 테스트 및 서빙 비용 분석 → 5) 소규모 롤아웃과 안전장치 설정 → 6) 전사 배포 후 모니터링·재최적화 주기 운영. 이 과정에서 프롬프트 최적화를 반복 적용해 성능·비용 균형을 지속적으로 개선한다.