피드로 돌아가기
Semantic Search at Scale: What I Learned Building RAG Infrastructure at Microsoft Copilot
Dev.toDev.to
AI/ML

Hybrid Search와 Re-ranking 도입을 통한 RAG 검색 품질 25% 향상

Semantic Search at Scale: What I Learned Building RAG Infrastructure at Microsoft Copilot

Nrk Raju Guthikonda2026년 4월 12일6intermediate

Context

단순한 Chunking과 Vector Search 기반의 튜토리얼 방식 RAG는 프로덕션 환경의 도메인 특수성과 데이터 복잡성을 반영하지 못하는 한계 존재. 특히 Semantic Boundary 훼손과 단순 유사도 기반 검색의 낮은 정밀도로 인해 실제 사용자 쿼리에 대한 답변 품질 저하 발생.

Technical Solution

  • Semantic Boundary를 보존하는 도메인 특화 Chunking 전략을 통한 문맥 파악 능력 강화
  • Broad Retrieval 후 Cross-Encoder 기반의 Re-ranking 단계를 추가하여 검색 결과의 정밀도 극대화
  • Semantic Search의 한계를 보완하기 위해 BM25 기반 Keyword Search를 결합한 Hybrid Search 구조 설계
  • Reciprocal Rank Fusion(RRF) 알고리즘을 활용한 서로 다른 검색 결과의 가중치 합산 및 순위 재조정
  • Recall@K, MRR, NDCG 등 정량적 Retrieval Metric을 파이프라인에 통합하여 지속적 성능 검증 체계 구축

1. 단순 길이 기반 Split 대신 헤더 및 문단 구조를 반영한 Semantic Chunking 적용 여부 검토

2. 검색 결과의 Top-K를 3배수 이상 넓게 잡고 Re-ranker를 통한 최종 필터링 단계 추가

3. 특정 식별자나 에러 코드 검색을 위해 BM25 기반 Keyword Search 결합 및 RRF 적용

4. Faithfulness 및 MRR 등 정량적 평가 지표를 통한 회귀 테스트 자동화

원문 읽기