피드로 돌아가기
GraphRAG Local Search Text Unit Selection Strategy: Design Trade-offs and Improvement Directions
Dev.toDev.to
AI/ML

GraphRAG Local Search의 Depth-first 제약 극복 및 Coverage 확장 전략

GraphRAG Local Search Text Unit Selection Strategy: Design Trade-offs and Improvement Directions

eyanpen2026년 5월 15일7advanced

Context

GraphRAG Local Search는 Entity Similarity 기반의 Text Unit 선택 전략을 사용하여 LLM Context Window를 채움. 단일 정렬 차원(entity_index, -num_relationships)을 사용하는 구조로 인해 빈도가 높은 Popular Entity가 Token Budget을 독점하여 다른 핵심 Entity의 정보가 유실되는 Breadth 부족 현상 발생.

Technical Solution

  • Relevance Depth와 Coverage Breadth 간의 Trade-off 분석을 통한 다중 목적 최적화 문제 정의
  • 기존의 단순 정렬 방식에서 탈피하여 Minimum Guarantee 기반의 2단계 선택 프로세스 도입
  • Phase 1에서 선택된 모든 Entity에 대해 최소 1개의 Text Unit을 우선 할당하여 기본 Coverage 확보
  • Phase 2에서 남은 Token Budget을 기존의 Similarity 및 Relationship Density 기반 정렬 순으로 채우는 하이브리드 구조 설계
  • 단일 정렬 차원이 가진 한계를 해결하여 Cross-entity 관계 분석 시 정보 손실 최소화
  • 기존 Depth-first 전략의 장점인 고밀도 정보 추출 능력을 유지하며 Entity 간 다양성 확보

- RAG 시스템 설계 시 단순 유사도 정렬이 특정 문서의 독점으로 이어지는 'Budget Monopolization' 위험 검토 - 다중 엔티티 관계 추출이 필요한 쿼리의 경우, 단순 정렬 대신 '최소 할당제(Minimum Guarantee)' 적용 고려 - Retrieval 단계에서 Relevance, Density, Coverage, Diversity라는 4가지 최적화 지표의 균형 설정 필요

원문 읽기