피드로 돌아가기
Dev.toAI/ML
원문 읽기
Week Node 기반 간접 연결로 7.1만 Edge의 비정형 비즈니스 데이터 Graph RAG 구현
We Built a Custom Graph RAG to Let AI Answer "Did That Initiative Actually Work?"
AI 요약
Context
Initiative와 KPI 간의 외래 키(FK) 부재로 인한 데이터 간 파편화 발생. 수천 개의 Initiative와 수백 개의 Metric 사이의 상관관계 분석을 위한 수동 작업에 매주 30~60분이 소요되는 비효율적 구조.
Technical Solution
- Initiative와 Metric 간 직접 연결 시 발생하는 Edge Explosion(최대 2,000만 개) 방지를 위해 Week Node를 앵커로 하는 간접 연결 구조 설계
- 시간 축(Week)을 통한 간접 연결로 관계 복잡도를 선형적으로 제어하며 인과관계 후보군을 탐색하는 구조 구축
- MetricDomain 매핑을 통한 도메인 지식의 구조화로 Initiative 카테고리와 Metric 그룹 간의 시맨틱 브릿지 형성
- AI Embedding 기반의 SIMILAR_TO 관계 사전 계산을 통한 유사 사례 탐색 최적화
- Cloud Run Job 기반의 Weekly Graph Rebuild 및 Daily Data Loader 파이프라인 구축으로 데이터 최신성 유지
- MCP Server를 통한 Graph Search 및 Time Series Analysis 인터페이스 제공으로 AI의 자율적 탐색 지원
실천 포인트
- 데이터 간 직접 관계 정의가 어려운 경우 시간(Time)이나 도메인(Domain) 같은 중간 매개 노드 도입 검토 - 정답이 확정되지 않은 가설 단계의 관계를 Graph Edge로 직접 정의하기보다 후보군 탐색 구조로 설계 - 비즈니스 도메인 지식(Tacit Knowledge)을 하드코딩하는 대신 AI 제안 및 인간 승인 워크플로우 도입 고려 - LLM Context Window 한계를 극복하기 위해 전체 데이터 덤프 대신 Graph Traversal 기반의 필요한 정보만 추출하는 RAG 전략 채택