VORTEXRAG 도입으로 Faithfulness 0.94 달성 및 EM 13.6%p 개선

I Spent 6 Months Fixing RAG. Here's What I Found (And Built)

vigneshwar2026년 5월 19일6분advanced

AI 요약

Context

기존 Naive RAG의 단순한 'Embed-Retrieve-Stuff' 파이프라인으로 인한 Semantic Drift와 Context Poisoning 문제 발생. 특히 Multi-hop 쿼리 처리 시 리트리벌 단계의 의도 이탈과 일부 오답 덩어리에 의한 LLM 환각 현상이 심화되는 한계 노출.

Technical Solution

Tri-Vector Encoding(TVE)을 통한 Semantic, Syntactic, Causal 정보의 다각적 벡터화로 단순 유사도를 넘어선 인과 관계 포착
Vortex Retrieval Cone(VRC) 설계를 통해 단순 Cosine Similarity의 한계를 극복하고 Causal Depth에 따른 가중치 부여
Semantic Drift Corrector(SDC)의 Re-anchoring 매커니즘을 적용하여 Multi-hop 과정의 쿼리 임베딩 궤적 보정
Context Poison Guard(CPG)의 ESR(Entity-salience ratio) 기반 정제 알고리즘을 통한 저품질 컨텍스트 제거
Rank Fusion Gate(RFG)의 곱셈 기반 퓨전 방식을 도입하여 특정 신호 결여 시 해당 문서를 즉시 배제하는 Veto 메커니즘 구현
Causal Context Builder(CCB)를 통해 인과적 중요도가 높은 덩어리를 컨텍스트 최상단에 배치함으로써 Lost-in-the-Middle 현상 해결

실천 포인트

1. Multi-hop 쿼리 설계 시 Anchor Embedding을 활용한 드리프트 체크 로직 검토

2. 컨텍스트 윈도우 구성 시 중요도 기반의 Re-ordering 전략 적용

3. 가산적 Rank Fusion 대신 특정 조건에서 강한 페널티를 주는 곱셈적 Fusion 구조 고려

4. ROUGE-L과 NLI 기반의 최종 응답 검증 게이트 설치

태그

#Semantic Drift #Multi-hop Retrieval #RAG #Causal Inference #Hallucination

원문 읽기