피드로 돌아가기
GeekNewsAI/ML
원문 읽기
Show GN: turbo-graph – turbovec에 그래프 메모리/필터 캐시를 얹은 constrained RAG 인덱스
turbovec 기반 Graph Memory Layer 구축을 통한 Constrained RAG 최적화
AI 요약
Context
기존 RAG 시스템의 ACL, Tag, Time Window 등 복잡한 필터 조건을 App Layer에서 처리하며 발생하는 중복 로직 및 성능 저하 문제. Vector Search와 Graph/BM25 결과의 빈번한 Rerank 및 Explain 과정에서 발생하는 오버헤드 발생.
Technical Solution
- turbovec-compatible core 유지를 통한 기존 벡터 검색 성능 확보
- Graph/Metadata View Compilation 도입을 통한 필터링 로직의 인덱스 레이어 이관
- Cache Reuse 메커니즘 적용으로 반복적인 쿼리 조합 연산 비용 절감
- Graph Rerank 및 Explain Telemetry 기능을 인덱스 내장하여 App Layer의 연산 부하 감소
- 복합 제약 조건(Tenant ACL ∩ Tag ∩ Source 등)의 통합 처리를 위한 Constrained Index 구조 설계
실천 포인트
- RAG의 필터링 조건이 복잡할 경우 App Layer가 아닌 인덱스 레이어에서의 View Compilation 검토 - Vector Search 결과와 Graph/BM25 결과의 결합 빈도가 높다면 통합 Rerank 레이어 설계 고려 - 쿼리 결과에 대한 Explainability 확보를 위해 Telemetry 기능을 데이터 엔진 수준에서 구현