피드로 돌아가기
Dev.toAI/ML
원문 읽기
Prompt Tuning 대신 Retrieval 최적화로 RAG 정밀도 극대화
Most RAG Problems Are Retrieval Problems. Here Are 8 Fixes That Worked for Me
AI 요약
Context
LLM 프롬프트 수정만으로는 컨텍스트 윈도우 내 필수 정보 누락 문제를 해결하기 어려움. 단순 Dense Embedding 기반 검색은 고유 명사나 에러 코드 같은 정확한 토큰 매칭에 취약하여 답변 품질 저하를 유발함.
Technical Solution
- BM25와 Dense Vector 검색을 결합한 Hybrid Search 도입으로 시맨틱 의미와 리터럴 문자열 매칭 동시 확보
- Reciprocal Rank Fusion(RRF) 알고리즘 적용을 통한 서로 다른 스코어 체계의 검색 결과 리스트 통합
- Cross-Encoder 기반의 Reranking 단계를 추가하여 Recall 중심의 1차 결과에서 Precision 중심의 최종 후보군 선별
- LLM을 활용한 Contextual Chunking으로 개별 청크에 문서 전체 맥락을 주입하여 검색 가능성 향상
- Parent-Document Retriever 구조 설계를 통해 검색은 작은 단위로 수행하고 모델 제공은 큰 단위의 컨텍스트로 전달
- MultiQueryRetriever 기반의 질의 재작성을 통해 사용자 질문과 문서 간의 표현 격차 해소
실천 포인트
- Dense-only 검색에서 벗어나 BM25를 결합한 Hybrid Search 검토 - Retrieval 결과의 Top-k 수치만 높이기보다 Reranker 도입을 통한 순위 재조정 적용 - Indexing 단계에서 LLM을 이용한 청크별 컨텍스트 요약문 추가 여부 판단 - 데이터 특성에 맞는 최적의 Chunk Size(256, 512, 1024 등)를 실험적으로 측정 및 설정