Hybrid Retrieval과 Reranking을 통한 RAG Hallucination 해결 및 신뢰성 확보

Build a RAG Pipeline From Scratch (Production Patterns That Actually Matter)

Umesh Malik2026년 6월 12일6분intermediate

AI 요약

Context

단순 Vector Search 기반 RAG는 고유 명사 인식 불가 및 고정 크기 Chunking으로 인한 문맥 단절 문제를 야기함. LLM의 환각 현상은 모델 성능보다 Retrieval 단계의 품질 저하에서 기인하는 경우가 많음.

실천 포인트

1. 고정 크기 분할 대신 문서 구조(헤딩, 단락) 기반의 Semantic Chunking 적용

2. Vector-only 검색 대신 Hybrid Retrieval(Keyword + Vector) + Reranker 파이프라인 구축

3. 프롬프트 수정 전 Retrieval Eval Set을 구축하여 검색 단계의 Recall 지표 우선 검증

4. LLM 응답 시 '모름' 답변 허용 및 Source ID 기반 인용 강제 설정

태그