leangnews
Command Palette
Search for a command to run...
2025년 11월 08일 09:00
구글 ‘파일 서치’, 엔터프라이즈 DIY RAG 스택을 대체할까
기사 요약
- 구글이 Gemini API에 완전관리형 RAG인 파일 서치를 공개해 검색·임베딩·청킹을 일원화했다.
- 일부 기능은 쿼리 시 무료로 제공되며, 인덱싱된 임베딩은 100만 토큰당 $0.15에 과금된다.
- 경쟁사 대비 오케스트레이션 부담을 줄였고, 벡터 검색·출처 인용·광범위한 파일 포맷을 지원한다.
개요
기업들은 이제 검색 증강 생성(RAG)이 질의에 가장 근거 있는 정보를 찾아 응답의 정확도를 높여준다는 점을 잘 안다. 그러나 전통적 RAG 구축은 도구 조합과 엔지니어링 부담이 크다. 구글은 이를 해결하기 위해 Gemini API에 완전관리형 RAG 시스템인 File Search를 공개했다. 이 ‘구글 파일 서치’는 스토리지와 임베딩 생성 등 파이프라인 연결 작업을 크게 줄여준다.
구글 파일 서치: RAG 파이프라인 추상화
구글에 따르면 File Search는 “RAG의 복잡성을 대신 처리”한다. 파일 저장, 청킹 전략, 임베딩을 관리하고, 기존 generateContent API 안에서 바로 호출할 수 있어 도입 장벽을 낮춘다. 또한 벡터 검색을 통해 사용자의 질의 의미와 문맥을 이해해 프롬프트가 다소 부정확해도 문서에서 적합한 정보를 찾아 응답을 생성한다. 생성 근거가 된 문서의 특정 구절을 가리키는 출처 인용도 기본 제공한다.
요금, 모델, 파일 포맷 지원
기업은 쿼리 시점의 스토리지·임베딩 생성 등 일부 기능을 무료로 사용할 수 있으며, 파일을 인덱싱하면 임베딩 비용이 100만 토큰당 0.15달러로 과금된다. File Search는 MTEB(Massive Text Embedding Benchmark) 상위권에 오른 Google의 Gemini Embedding 모델을 기반으로 동작한다. 지원 포맷은 PDF, DOCX, TXT, JSON은 물론 “많은 범주의 프로그래밍 언어 파일”까지 포함한다.
전통적 RAG 대비 단순화
일반적으로 조직은 파일 수집·파싱 파이프라인을 구성해 청킹, 임베딩 생성과 업데이트를 조율하고, Pinecone 같은 벡터 데이터베이스를 계약해 검색 로직을 설계한 뒤, 모델의 컨텍스트 윈도 안에 결과를 맞춰 넣어야 한다. 필요하다면 출처 인용도 별도로 구현한다. 구글은 ‘구글 파일 서치’가 이 전 과정을 일괄 추상화해 오케스트레이션 부담을 크게 줄인다고 강조한다.
경쟁 제품과 차별점
이 도구는 OpenAI의 Assistants API 파일 검색 기능, AWS Bedrock의 데이터 자동화 관리형 서비스, Microsoft의 엔터프라이즈 RAG 솔루션과 직접 경쟁한다. 유사한 기능을 제공하지만, 구글은 ‘구글 파일 서치’가 RAG 파이프라인의 일부가 아니라 거의 전부를 추상화해 더 독립적으로 동작한다고 주장한다.
적용 사례: Phaser Studio
AI 게임 생성 플랫폼 Beam을 만든 Phaser Studio는 사내 3,000개 파일 라이브러리를 탐색하는 데 File Search를 활용했다고 밝혔다. CTO 리처드 데이비는 “총알 패턴 코드 스니펫, 장르 템플릿, 아키텍처 가이드 등 적합한 자료를 즉시 표면화해 준다”며 “며칠 걸리던 아이디어 프로토타이핑이 이제 몇 분 만에 플레이 가능한 수준이 된다”고 말했다.
지속적 RAG 실험과 가시성
많은 기업이 이미 에이전트 도입을 준비하며 RAG 파이프라인을 구축하기 시작했다. 정확성을 유지하고 비즈니스 인사이트를 끌어내기 위해서는 파이프라인에 대한 빠른 가시성이 필수다. ‘구글 파일 서치’는 이러한 요구를 단순화하려는 시도로, 벡터 검색·출처 인용·통합 스토리지 등 핵심 기능을 한곳에 모아 실험과 운영을 가속한다.