피드로 돌아가기
#Why Your RAG Pipeline Can't Answer Relationship Questions (And How We Fixed It)
Dev.toDev.to
AI/ML

GraphRAG 도입으로 CRM 관계 질의 정확도 96.7% 달성 및 토큰 86% 절감

#Why Your RAG Pipeline Can't Answer Relationship Questions (And How We Fixed It)

Vishnu K2026년 6월 4일9advanced

Context

기존 BasicRAG의 Flat Vector Index 방식은 단순 텍스트 유사도에 의존하여 다중 엔티티 간의 관계형 질의 처리에 한계 노출. CRM 데이터 특유의 복잡한 엔티티 간 연결 구조를 단순 텍스트 청크로 처리함에 따른 구조적 불일치 발생.

Technical Solution

  • TigerGraph 기반의 Graph Schema를 설계하여 Customer, Vendor, Outage 등 엔티티 간의 관계를 Directed/Undirected Edge로 명시적 모델링
  • Document 정점에 native HNSW Index를 구축하여 초기 시드 노드를 탐색하는 Vector Seed Phase 구현
  • GSQL의 Accumulator(SetAccum, MapAccum)를 활용해 시드 노드부터 관련 엔티티로 확장하는 Multi-hop Traversal 로직 적용
  • 단순 유사도 검색이 아닌 'Entity $\rightarrow$ Edge $\rightarrow$ Entity' 경로를 추적하여 관계 기반의 컨텍스트를 정밀하게 추출하는 2단계 Retrieval 파이프라인 구축
  • 데이터의 기하학적 구조(Geometry)와 검색 알고리즘을 일치시켜 Multi-entity Relationship 질문에 대응하는 구조적 해결책 제시

- 질의문에 'through', 'via', 'related to' 등 관계 추적이 필요한 키워드가 빈번한지 분석 - 단순 문서 검색을 넘어 엔티티 간의 Typed Relationship 정의가 필요한 도메인인지 검토 - Vector Search를 진입점(Seed)으로 사용하고 Graph Traversal로 컨텍스트를 확장하는 하이브리드 전략 고려

원문 읽기