피드로 돌아가기
Dev.toAI/ML
원문 읽기
Context Window 한계를 극복하는 Vector Substrate 기반 Agentic Wiki 설계
Reports of RAG's death have been greatly exaggerated
AI 요약
Context
단순 Retrieval 위주의 RAG는 매 질의마다 재탐색 비용이 발생하는 Stateless 구조의 한계를 가짐. Karpathy의 Living Wiki 방식은 지식을 누적하는 Persistent Artifact를 지향하나, 단순 파일 탐색 방식은 데이터 규모 증가 시 O(n)의 시간 복잡도로 인해 Context Window 임계치에서 시스템 붕괴가 발생함.
Technical Solution
- Vector Embeddings를 하부 Substrate로 배치하여 데이터 규모와 무관한 밀리초 단위의 Semantic Retrieval 구현
- LLM 기반 Auto-tagging을 통한 계층적 태그 트리 구축 및 데이터 접근 범위(Scope) 제어
- Async Semantic Edges 설계를 통한 백그라운드 임베딩 및 클러스터링으로 지식 그래프 자동 구조화
- Vector Retrieval 결과물을 기반으로 LLM이 종합 기사를 생성하는 Wiki Synthesis 프로세스 도입
- Agentic Chat과 Canvas 뷰를 결합하여 실시간 Semantic Search 결과에 기반한 Grounding 수행
실천 포인트
- 데이터 규모가 100페이지 이하인 소규모 지식 베이스의 경우 단순 파일 인덱싱(ls)으로 충분한지 검토 - 1,000페이지 이상의 확장성을 고려한다면 단순 Agentic Grep 대신 Vector Database 도입 필수 - 단순 Q&A를 넘어 지식의 누적과 연결이 필요할 때 'Vector Index(하부) + Synthesis Wiki(상부)' 계층 구조 설계 적용 - LLM의 컨텍스트 윈도우 크기에 의존하지 않는 독립적인 Retrieval Substrate 구축 여부 확인