GraphRAG 도입으로 CRM 관계 질의 정확도 96.7% 달성 및 토큰 86% 절감

#Why Your RAG Pipeline Can't Answer Relationship Questions (And How We Fixed It)

Vishnu K2026년 6월 4일9분advanced

AI 요약

Context

기존 BasicRAG의 Flat Vector Index 방식은 단순 텍스트 유사도에 의존하여 다중 엔티티 간의 관계형 질의 처리에 한계 노출. CRM 데이터 특유의 복잡한 엔티티 간 연결 구조를 단순 텍스트 청크로 처리함에 따른 구조적 불일치 발생.

Technical Solution

TigerGraph 기반의 Graph Schema를 설계하여 Customer, Vendor, Outage 등 엔티티 간의 관계를 Directed/Undirected Edge로 명시적 모델링
Document 정점에 native HNSW Index를 구축하여 초기 시드 노드를 탐색하는 Vector Seed Phase 구현
GSQL의 Accumulator(SetAccum, MapAccum)를 활용해 시드 노드부터 관련 엔티티로 확장하는 Multi-hop Traversal 로직 적용
단순 유사도 검색이 아닌 'Entity $\rightarrow$ Edge $\rightarrow$ Entity' 경로를 추적하여 관계 기반의 컨텍스트를 정밀하게 추출하는 2단계 Retrieval 파이프라인 구축
데이터의 기하학적 구조(Geometry)와 검색 알고리즘을 일치시켜 Multi-entity Relationship 질문에 대응하는 구조적 해결책 제시

실천 포인트

- 질의문에 'through', 'via', 'related to' 등 관계 추적이 필요한 키워드가 빈번한지 분석 - 단순 문서 검색을 넘어 엔티티 간의 Typed Relationship 정의가 필요한 도메인인지 검토 - Vector Search를 진입점(Seed)으로 사용하고 Graph Traversal로 컨텍스트를 확장하는 하이브리드 전략 고려

태그

#HNSW #TigerGraph #GSQL #GraphRAG #Multi-hop Traversal

원문 읽기