피드로 돌아가기
Dev.toAI/ML
원문 읽기
GraphRAG 도입을 통한 Token 소모 42% 절감 및 분석 정확도 향상
"Spartans-GraphRAG: Token-Efficient Threat Intelligence with TigerGraph"
AI 요약
Context
기존 Basic RAG의 Vector Similarity 기반 방식은 복잡한 Multi-hop Reasoning 요구 시 불필요한 텍스트 덩어리를 대량 삽입하는 한계 존재. 이로 인한 Token 비용 증가와 컨텍스트 윈도우 낭비 및 분석 효율 저하 문제 발생.
Technical Solution
- TigerGraph 기반 Knowledge Graph 구축을 통한 사이버 보안 도메인의 복잡한 엔티티 관계 구조화
- HybridRetriever.py 수정을 통한 Context Assembly 로직 최적화
- 서술형 문장을 (Subject | Predicate | Object) 형태의 Compact Triples 포맷으로 변환하여 Prompt 크기 최소화
- Llama-3.3-70B 모델과 Cross-encoder Reranker 기반의 강력한 Baseline 구축을 통한 검증 정밀도 확보
- LLM-as-a-Judge 및 BERTScore F1 지표를 활용한 정량적 성능 평가 체계 설계
실천 포인트
- Multi-hop 추론이 필요한 도메인에서 Vector DB의 단순 검색 대신 Knowledge Graph 도입 검토 - LLM에 전달하는 컨텍스트를 자연어 문장이 아닌 Compact Triples 형태로 구조화하여 Token 비용 절감 시도 - RAG 성능 평가 시 단순 생성 결과가 아닌 BERTScore F1 및 LLM-as-a-Judge 기반의 정량적 지표 설정