피드로 돌아가기
Dev.toAI/ML
원문 읽기
VORTEXRAG 도입으로 Faithfulness 0.94 달성 및 EM 13.6%p 개선
I Spent 6 Months Fixing RAG. Here's What I Found (And Built)
AI 요약
Context
기존 Naive RAG의 단순한 'Embed-Retrieve-Stuff' 파이프라인으로 인한 Semantic Drift와 Context Poisoning 문제 발생. 특히 Multi-hop 쿼리 처리 시 리트리벌 단계의 의도 이탈과 일부 오답 덩어리에 의한 LLM 환각 현상이 심화되는 한계 노출.
Technical Solution
- Tri-Vector Encoding(TVE)을 통한 Semantic, Syntactic, Causal 정보의 다각적 벡터화로 단순 유사도를 넘어선 인과 관계 포착
- Vortex Retrieval Cone(VRC) 설계를 통해 단순 Cosine Similarity의 한계를 극복하고 Causal Depth에 따른 가중치 부여
- Semantic Drift Corrector(SDC)의 Re-anchoring 매커니즘을 적용하여 Multi-hop 과정의 쿼리 임베딩 궤적 보정
- Context Poison Guard(CPG)의 ESR(Entity-salience ratio) 기반 정제 알고리즘을 통한 저품질 컨텍스트 제거
- Rank Fusion Gate(RFG)의 곱셈 기반 퓨전 방식을 도입하여 특정 신호 결여 시 해당 문서를 즉시 배제하는 Veto 메커니즘 구현
- Causal Context Builder(CCB)를 통해 인과적 중요도가 높은 덩어리를 컨텍스트 최상단에 배치함으로써 Lost-in-the-Middle 현상 해결
실천 포인트
1. Multi-hop 쿼리 설계 시 Anchor Embedding을 활용한 드리프트 체크 로직 검토
2. 컨텍스트 윈도우 구성 시 중요도 기반의 Re-ordering 전략 적용
3. 가산적 Rank Fusion 대신 특정 조건에서 강한 페널티를 주는 곱셈적 Fusion 구조 고려
4. ROUGE-L과 NLI 기반의 최종 응답 검증 게이트 설치