Perplexity, 대규모 검색 API로 구글 검색 인프라에 도전

Perplexity, 대규모 검색 API로 구글 검색 인프라에 도전

Perplexity, 대규모 검색 API로 구글 검색 인프라에 도전


기사 요약

  • Perplexity AI가 개발자에게 초대형 웹 인덱스를 개방하는 Perplexity 검색 API를 공개하며 구글의 개발자용 검색 지배력에 정면으로 도전했다.
  • 실시간 인덱싱, 부분 문서 정밀도, 하이브리드 검색과 출처 표기 중심의 결과 구조 등으로 AI 애플리케이션에 최적화했다.
  • 규제 압박과 비광고형 수익 모델을 기회로 삼지만, 구글의 규모·알고리즘 우위와 법적 분쟁, 인간 검증 필요성은 여전한 과제다.

출시 배경과 목표: Perplexity 검색 API

Perplexity AI는 자사의 답변 엔진을 구동하는 것과 동일한 초대형 웹 인덱스를 개발자에게 직접 개방하는 Perplexity 검색 API를 공개했다. 수천억 개 웹페이지에 걸친 인덱스, 실시간 업데이트, AI 친화적 결과 포맷을 앞세워 개발자용 검색 인프라 분야에서 구글의 우위를 정면으로 겨냥한다. 회사는 “기존 검색 엔진이 상업적 트래픽을 우선시해 개발자 접근을 제한해 왔다”라고 비판하며, 신생 기업은 의미 있는 대안을 내놓을 규모가 부족했다고 지적한다. 이번 행보는 8월에 있었던 구글 크롬 브라우저에 대한 345억 달러 규모의 과감한 인수 제안에 이은 것으로, 검색 산업의 판을 흔들려는 전략적 포석이다.

실시간 인덱싱과 ‘부분 문서 정밀도’

이 시스템은 초당 수만 건의 변화를 처리해 새로운 콘텐츠를 수 초 내에 검색 가능하게 만들며, 전통적 엔진에서 고질적인 ‘정보 낙후’ 문제를 줄인다. 아울러 문서 전체가 아니라 페이지 내부의 특정 구절을 찾아 순위를 매기는 ‘부분 문서 정밀도’를 적용해 대형 언어모델이 소비하기 좋은, 맥락적으로 정확한 결과를 제공한다. 키워드 매칭과 의미 기반 검색을 결합한 하이브리드 검색으로 대화형·복합 질의를 이해하면서도 정밀도를 유지하고, 결과는 출처 인용이 풍부한 구조화 포맷으로 반환된다. Perplexity 검색 API는 링크 나열 대신 가장 관련도 높은 스니펫과 하위 페이지 구절을 표면화해, 출처 표시를 기본값으로 제공함으로써 창작자 권리 보호에도 기여한다.

개발자 생태계: Search·Sonar와 오픈소스 평가

Perplexity는 개발자 콘솔과 문서를 통합한 플랫폼을 통해 Search와 Sonar API를 함께 제공한다. 또한 오픈소스 평가 프레임워크 ‘search_evals’를 공개해, 리소스를 투입하기 전에 어떤 검색 API든 품질과 성능을 벤치마크할 수 있게 했다. Perplexity 검색 API는 이러한 도구들과 결합되어 AI 애플리케이션, 백엔드 서비스, 웹 서비스에 손쉽게 통합되도록 설계됐다.

사업 확장, 규제 환경, 그리고 경쟁

Perplexity는 2022년 OpenAI·Meta·Quora 출신이 창업한 이후, 답변 엔진을 넘어 이메일 비서(월 200달러 Max 구독자 전용), 크로미움 기반 ‘Comet’ 브라우저 등으로 외연을 넓혔다. 8월에는 자사 기업가치(180억 달러)를 웃도는 345억 달러로 구글 크롬 인수를 제안하며 화제를 모았다. 한편 미국 법무부는 반독점 구제책으로 구글의 크롬 분리를 제안했고, 애널리스트들은 크롬을 약 500억 달러, 유튜브를 2,710억~5,500억 달러, 구글 클라우드를 5,490억~6,820억 달러로 추산한다. 광고에 의존하는 구글과 달리 Perplexity는 API 이용 요금으로 수익을 내 갈등 요인을 줄이고, 정확하고 유용한 정보 제공에 인센티브를 정렬한다. 이러한 환경은 Perplexity 검색 API의 초기 도입과 시장 침투에 우호적으로 작용할 수 있다.

한계와 전망

그럼에도 구글은 전 세계적 인프라, 캐싱·CDN, 검색 특화 하드웨어, 대규모 사용자 피드백을 바탕으로 하루 수십억 건의 질의를 처리하며 20여 년 축적된 우위를 보유한다. Perplexity는 AI 요약·추천의 정확성과 적합성을 위해 인간 검증이 필요하다는 점을 인정하며, 전통적 키워드 검색에서는 항상 최적의 결과를 내지 못할 수 있다. 백과사전 브리태니커가 제기한 저작권·불공정 경쟁 소송 등 법적 리스크도 상존한다. 그럼에도 이번 출시는 개발자가 전 지구적 규모의 검색 데이터를 활용할 수 있는 실질적 대안을 처음으로 제공했다는 점에서 의미가 크며, 특히 인용과 출처 중심 설계는 신뢰 가능한 정보가 필요한 엔터프라이즈 활용에 매력적으로 작용할 전망이다. 성공할 경우, 웹 데이터 접근의 민주화가 가속화되어 AI 혁신과 스타트업 개발 비용 절감, 정보 탐색 방식의 재편을 이끌 수 있다.