피드로 돌아가기
How to Build a RAG Pipeline for an Enterprise Knowledge Base That Actually Works in Production
Dev.toDev.to
AI/ML

Hybrid Retrieval과 Hierarchical Chunking 기반의 엔터프라이즈 RAG 설계 전략

How to Build a RAG Pipeline for an Enterprise Knowledge Base That Actually Works in Production

Open Craft2026년 6월 19일9intermediate

Context

단순 Keyword Search의 토큰 매칭 한계와 Vector Search의 과잉 검색(Over-retrieval) 문제로 인한 낮은 검색 정확도 발생. 특히 엔터프라이즈 환경의 용어 불일치와 정책 변경(Policy Drift)으로 인한 검색 신뢰성 저하가 병목 지점으로 작용.

Technical Solution

  • Keyword(Sparse)와 Vector(Dense) 검색을 병렬 실행 후 Reciprocal Rank Fusion 알고리즘으로 통합하는 Hybrid Retrieval 레이어 설계
  • 검색 정밀도 향상을 위해 Child Chunk로 검색하고 문맥 유지를 위해 Parent Chunk를 LLM에 전달하는 Hierarchical Chunking 구조 채택
  • 도메인 특화 데이터셋 기반의 MTEB 벤치마크 수행을 통한 최적의 Embedding Model 선정 프로세스 수립
  • 검색 단계에서 Metadata Filtering을 적용하여 문서 권한 및 유효 기간을 강제하는 보안 및 최신성 제어 로직 구현
  • 성능 저하 감지를 위해 Ground-truth 쿼리셋 기반의 Recall@k 정기 측정 및 자동 Re-chunking 파이프라인 구축

- 단순 Vector Search 대신 Hybrid Retrieval 도입 및 가중치 튜닝 검토 - 고정 크기 Chunking 대신 문서 구조를 반영한 Parent-Child 구조 설계 적용 - LLM 생성 단계가 아닌 Retrieval 레이어에서 Metadata 기반 권한 필터링 구현 - MTEB 등 표준 벤치마크와 실제 데이터 샘플을 통한 Embedding Model 성능 검증 - Recall@k 지표를 활용한 Retrieval 성능 모니터링 및 재학습 주기 설정

원문 읽기