leangnews
Command Palette
Search for a command to run...
2025년 12월 12일 10:02
Cohere Rerank 4, 컨텍스트 4배로 에이전트 오류 줄이고 검색 정확도 향상
기사 요약
- 코히어가 Rerank 3.5 출시 1년 만에 컨텍스트 윈도를 32K로 확장한 Cohere Rerank 4를 공개해 긴 문서와 다중 패시지 평가를 강화했습니다.
- Rerank 4는 Fast·Pro 두 가지로 제공되며, 크로스 인코더 구조로 바이인코더 임베딩의 한계를 보완해 RAG 기반 엔터프라이즈 검색 정확도를 높입니다.
- 광범위한 벤치마크와 100+개 언어 지원, North 플랫폼 통합, 그리고 주석 없이 학습하는 셀프 러닝으로 토큰 사용과 재시도 횟수를 줄이며 실제 헬스케어 도메인에서도 성능 향상을 입증했습니다.
Cohere Rerank 4: 컨텍스트 윈도 32K로 4배 확장
Cohere는 Rerank 3.5 이후 약 1년 만에 컨텍스트 윈도를 32K로 키운 Cohere Rerank 4를 공개했습니다. 더 긴 문서를 다루고 여러 패시지를 동시에 평가하며, 문서 섹션 간 관계까지 포착해 현실적인 문서 유형에서의 랭킹 정확도와 검색 결과 관련성에 대한 신뢰도를 높입니다.
Rerank 4 Fast와 Pro: 용도별 최적화
Rerank 4는 두 가지 버전으로 제공됩니다. Fast는 소형 모델로 전자상거래, 프로그래밍, 고객지원 등 속도와 정확도가 모두 중요한 경우에 적합합니다. Pro는 리스크 모델링이나 데이터 분석처럼 더 깊은 추론과 정밀도가 필요한 업무에 맞춰 최적화되었습니다.
엔터프라이즈 검색 정확도 향상: 크로스 인코더의 강점
엔터프라이즈 검색의 중요성이 커지는 가운데, Cohere Rerank 4는 초기 검색 결과를 정교하게 재정렬해 정확도를 크게 끌어올립니다. 일부 바이인코더 임베딩이 놓치기 쉬운 미묘한 의미 차이를, 쿼리와 후보를 공동 처리하는 크로스 인코더 구조로 포착하고 가장 관련 있는 항목이 상위에 오도록 재배치합니다.
성능 벤치마크와 다국어 지원
코히어는 금융·헬스케어·제조 도메인 과제를 대상으로 Qwen Reranker 8B, Elasticsearch의 Jina Rerank v3, MongoDB의 Voyage Rerank 2.5 등과 비교 벤치마크를 진행했으며, Rerank 4는 경쟁 모델에 견주어 강력한 성능을 보였습니다. 또한 100개 이상 언어를 이해하고 10대 주요 비즈니스 언어에서 최첨단 수준의 검색 성능을 제공합니다.
North 통합과 운영 비용 절감
Cohere Rerank 4는 코히어의 에이전틱 AI 플랫폼 North의 핵심 구성 요소로, 하이브리드·벡터·키워드 기반 검색 솔루션에 최소한의 코드 변경만으로 매끄럽게 통합됩니다. 복잡한 다단계 상호작용으로 모델 호출이 늘고 컨텍스트가 포화되기 쉬운 시나리오에서, 저품질 정보를 LLM에 전달하기 전에 걸러 토큰 사용량과 에이전트 재시도 횟수를 줄입니다.
셀프 러닝: 주석 없이 선호를 학습하는 첫 재랭킹
Cohere Rerank 4의 또 다른 차별점은 재랭킹 모델 최초의 셀프 러닝 기능입니다. 추가 주석 데이터 없이도 사용자 선호 콘텐츠 유형과 문서 코퍼스를 지정하면 모델이 이를 학습해 활용합니다(GPT-5.2 같은 기반 모델의 선호 기억 방식과 유사). 특히 Rerank 4 Fast와 함께 사용할 때 원하는 데이터에 더 정확히 접근해 대형 모델과의 경쟁력도 높아집니다.
도메인 확장 사례: 헬스케어 검색 고도화
코히어는 임상의가 환자별 정보를 찾아야 하는 상황을 모사한 헬스케어 데이터셋으로 셀프 러닝을 검증했고, Cohere Rerank 4 활성화 시 일관되고 큰 폭의 이득을 확인했습니다. 그 결과, 특히 Rerank 4 Fast에서 전반적으로 검색 품질이 뚜렷하게 향상됐습니다.