노이즈 제거로 Hallucination 해결, Context Pruning 전략

Context Pruning Unlocks Superior RAG Accuracy Metrics

InferenceDaily2026년 4월 7일1분intermediate

AI 요약

Context

Raw top-k retrieval 방식의 단순 데이터 주입 구조. 불필요한 정보 유입으로 인한 LLM의 Hallucination 발생. Context Window 내 노이즈 증가로 인한 모델 attention 저하.

데이터의 양보다 Signal-to-Noise Ratio 관점의 전처리가 RAG 시스템의 생성 품질을 결정하는 핵심 설계 원칙.

실천 포인트

단순 top-k 추출 대신 Reranker와 유사도 임계값을 결합한 필터링 파이프라인을 구축하여 토큰 오버헤드를 줄일 것

태그