피드로 돌아가기
There Are Too Many RAG Optimization Techniques, So I Organized Them — and the Big Picture Finally Made Sense
Dev.toDev.to
AI/ML

Query 최적화와 Result 필터링을 통한 RAG 검색 정확도 극대화 전략

There Are Too Many RAG Optimization Techniques, So I Organized Them — and the Big Picture Finally Made Sense

nagi2026년 4월 15일10intermediate

Context

단순 Vector Search 기반 RAG의 한계로 인한 검색 정확도 저하 및 의미적 거리 차이 발생. 질문과 답변의 서로 다른 텍스트 스타일로 인해 Vector Space 내 거리 간극이 발생하는 병목 지점 식별.

Technical Solution

  • LLM을 활용하여 사용자 질문을 다각도로 재구성하는 Multi Query 및 RAG-Fusion 도입을 통한 검색 누락 방지
  • 가상 답변을 생성하여 질문-문서 간 Vector Distance를 좁히는 HyDE 기법 적용으로 검색 정밀도 향상
  • 복잡한 질문을 하위 질문으로 분해하여 개별 검색하는 Decomposition 구조 설계를 통한 복합 쿼리 처리
  • RRF(Reciprocal Rank Fusion) 알고리즘 기반의 랭킹 병합을 통한 최적의 문서 순위 재배치
  • Vector Search와 BM25를 결합한 Hybrid Search 도입으로 고유 명사 검색 정확도 보완
  • 검색 결과의 품질을 재평가하여 최적의 컨텍스트만 선별하는 Re-ranking 프로세스 구축

1. 고유 명사 검색 실패 시 Hybrid Search(Vector + BM25) 우선 검토

2. 가성비 높은 정확도 개선을 위해 Re-ranking 단계 추가 적용

3. 질문과 문서의 스타일 차이가 클 경우 HyDE 도입 고려(단, Latency 증가분 계산 필수)

4. 데이터 소스가 다양할 경우 Routing 레이어 설계를 통한 효율적 경로 제어

원문 읽기