피드로 돌아가기
Dev.toAI/ML
원문 읽기
Vector DB를 대체한 POSIX Filesystem 기반 AI Memory로 세션 생성 시간 46s에서 100ms로 단축
We Built an AI CFO Managing $30B in Assets. The Secret Was a Filesystem.
AI 요약
Context
특수 목적의 Tool 래퍼와 Vector DB 기반의 RAG 파이프라인을 통한 컨텍스트 관리 시도. Tool 목록 증가에 따른 Routing 정확도 저하와 토큰 소모량 증가라는 아키텍처적 병목 현상 발생.
Technical Solution
- 복잡한 Memory API를 제거하고 AI Agent에게 Persistent Directory와 Shell 접근 권한을 부여한 Filesystem 기반 설계 도입
- LLM이 사전 학습 단계에서 익힌 Unix Command(grep, cat, ls 등)를 활용해 스스로 데이터를 조직하고 검색하는 Self-organizing Workspace 구조 구현
- Vector Indexing 대신 표준 POSIX 인터페이스를 통한 데이터 읽기/쓰기로 Tool Routing 오버헤드 제거
- 사용자별 격리된 Namespace와 Sandbox 환경을 통해 데이터 보안 및 프로세스 격리 보장
- 파일 변경 시 HMAC-signed Webhook을 트리거하여 백엔드 워크플로우와 실시간 동기화하는 Event-driven 구조 채택
- Snapshot 및 Rollback 메커니즘을 통한 상태 관리 및 데이터 무결성 확보
실천 포인트
1. Agent의 Tool 개수가 증가하여 Routing 오류가 빈번한지 검토
2. 복잡한 RAG 파이프라인 대신 단순 텍스트 파일과 grep/find 조합의 성능 가능성 테스트
3. LLM의 Pretraining 데이터 분포(Code, Shell)에 부합하는 인터페이스 설계 여부 확인
4. 상태 저장 시 API 기반의 정형 데이터 외에 Agent가 자유롭게 기록하는 Unstructured Scratchpad 도입 고려