피드로 돌아가기
Most RAG Problems Are Retrieval Problems. Here Are 8 Fixes That Worked for Me
Dev.toDev.to
AI/ML

Prompt Tuning 대신 Retrieval 최적화로 RAG 정밀도 극대화

Most RAG Problems Are Retrieval Problems. Here Are 8 Fixes That Worked for Me

Michael Miscanuk2026년 6월 14일6intermediate

Context

LLM 프롬프트 수정만으로는 컨텍스트 윈도우 내 필수 정보 누락 문제를 해결하기 어려움. 단순 Dense Embedding 기반 검색은 고유 명사나 에러 코드 같은 정확한 토큰 매칭에 취약하여 답변 품질 저하를 유발함.

Technical Solution

  • BM25와 Dense Vector 검색을 결합한 Hybrid Search 도입으로 시맨틱 의미와 리터럴 문자열 매칭 동시 확보
  • Reciprocal Rank Fusion(RRF) 알고리즘 적용을 통한 서로 다른 스코어 체계의 검색 결과 리스트 통합
  • Cross-Encoder 기반의 Reranking 단계를 추가하여 Recall 중심의 1차 결과에서 Precision 중심의 최종 후보군 선별
  • LLM을 활용한 Contextual Chunking으로 개별 청크에 문서 전체 맥락을 주입하여 검색 가능성 향상
  • Parent-Document Retriever 구조 설계를 통해 검색은 작은 단위로 수행하고 모델 제공은 큰 단위의 컨텍스트로 전달
  • MultiQueryRetriever 기반의 질의 재작성을 통해 사용자 질문과 문서 간의 표현 격차 해소

- Dense-only 검색에서 벗어나 BM25를 결합한 Hybrid Search 검토 - Retrieval 결과의 Top-k 수치만 높이기보다 Reranker 도입을 통한 순위 재조정 적용 - Indexing 단계에서 LLM을 이용한 청크별 컨텍스트 요약문 추가 여부 판단 - 데이터 특성에 맞는 최적의 Chunk Size(256, 512, 1024 등)를 실험적으로 측정 및 설정

원문 읽기