피드로 돌아가기
Dev.toAI/ML
원문 읽기
RRF 기반 Hybrid Retrieval을 통한 Vector Hallucination 해결 및 정밀도 확보
The Hybrid Retrieval Pattern
AI 요약
Context
Semantic Vector Search의 고유 특성으로 인한 구체적인 식별자 및 팩트 기반 데이터 검색의 정확도 저하 문제 발생. 유사한 임베딩 값으로 인해 엉뚱한 문서를 반환하는 Vector Hallucination 현상이 시스템 신뢰성을 저하시키는 병목 지점으로 작용.
Technical Solution
- Dense Channel과 Sparse Channel을 병렬로 운영하는 Two-Channel Retrieval 구조 설계
- Semantic 의미 파악을 위한 Vector Index 기반의 Dense Search 수행
- 정확한 키워드 및 식별자 매칭을 위한 BM25 기반의 Sparse Search 병행
- 서로 다른 스코어 체계를 가진 두 채널의 결과를 통합하기 위한 Reciprocal Rank Fusion(RRF) 알고리즘 적용
- RRF를 통한 재랭킹 과정으로 의미적 맥락과 문자열 일치도를 동시에 확보한 단일 결과 셋 생성
- 도메인 특성에 따라 키워드와 벡터 채널의 가중치를 조정하는 튜닝 프로세스 도입
실천 포인트
1. 고유 식별자(Part Number, ID 등) 검색 비중이 높은 서비스인지 확인
2. Vector DB 도입 전 BM25와 같은 전통적 Full-text Search 인덱스 유지 여부 검토
3. 두 검색 채널의 결과 통합을 위한 RRF 알고리즘 구현 및 가중치 튜닝 계획 수립
4. 인덱스 이중 관리에 따른 스토리지 비용 및 데이터 Ingestion 파이프라인 부하 분석