Hybrid-Rerank 도입을 통한 Clinical Retrieval Recall@5 86% 달성

Two Retrieval Methods Are Better Than One: Evidence from 500 Clinical Queries

Igor Eduardo2026년 5월 13일2분intermediate

AI 요약

Context

포르투갈어 임상 텍스트 환경에서 단일 검색 방식의 한계 분석. BM25와 Dense Retrieval이 서로 다른 유형의 쿼리를 해결한다는 특성에 주목하여 상호 보완적 구조의 필요성 제기.

Technical Solution

BM25와 BioBERTpt 기반 Dense Retrieval을 병렬 배치한 Hybrid Retrieval 아키텍처 설계
서로 다른 스코어 체계를 가진 검색 결과의 통합을 위해 Reciprocal Rank Fusion(RRF) 알고리즘 적용
RRF 기반 후보군을 Cross-encoder로 재정렬하는 Hybrid-Rerank 파이프라인 구축을 통한 정밀도 향상
McNemar's test를 통한 BM25와 Dense 모델 간의 상보적 성능 검증 및 통계적 유의성 확보
단순 LLM 프롬프트 방식이 아닌 n-gram overlap 기반의 Deterministic Citation Verification 로직 구현

Impact

Recall@5 지표 기준 BM25-only(0.71) 대비 Hybrid-Rerank(0.86)로 성능 개선
MRR 수치 0.64에서 0.79로 상승하며 검색 정확도 확보
Citation F1 점수 0.82에서 0.93으로 증가하며 참조 무결성 강화

Key Takeaway

특정 도메인에서 단일 검색 모델의 성능 최적화보다 서로 다른 특성의 Retrieval 방식을 결합하는 Hybrid 전략이 더 효율적인 성능 향상을 제공함.

실천 포인트

- 도메인 특화 데이터셋 대상 BM25와 Dense Retrieval의 상보성 확인을 위해 McNemar's test 수행 - 서로 다른 랭킹 시스템 통합 시 스코어 정규화 과정 없이 적용 가능한 RRF 알고리즘 검토 - 검증 단계에서 LLM의 판단에 의존하기보다 n-gram overlap 등 Deterministic한 검증 로직 우선 적용

태그

#Recall@5 #Hybrid Retrieval #Cross Encoder #RRF #BioBERTpt

원문 읽기