피드로 돌아가기
Dev.toAI/ML
원문 읽기
Load Shape에 따른 Agent Memory 아키텍처 3종 최적화 분석
Three places to put agent memory
AI 요약
Context
LLM Agent의 Memory 구현 방식을 두고 단일 정답을 찾는 기존의 논의를 부정함. 실제로는 트래픽 패턴과 에이전트 역할에 따른 Load Shape가 다르며, 이에 최적화된 서로 다른 메모리 전략이 필요함을 분석함.
Technical Solution
- WUPHF: Broker 중심의 Multi-agent 환경을 위해 Channel Log에 Persistence를 두어 매 턴 새로운 Session을 생성하는 Stateless 구조 설계
- Stash: 고용량 Episode 처리를 위해 Postgres 및 pgvector 기반의 8단계 Background Consolidation Pipeline을 통한 구조화된 지식 추출 및 RAG Retrieval 적용
- Phantom: 단일 에이전트의 장기 과업 수행을 위해 Markdown 파일 트리 기반의 System Prompt 주입 방식을 통한 Narrative 연속성 유지
- Stash의 Confidence Decay: SQL 기반의 시간 경과에 따른 신뢰도 감쇠 로직을 통해 데이터 신선도를 관리하는 Graceful Fade 메커니즘 구현
- Load Shape 매칭: Turn-count 기반 협업은 Channel Log, 시간 단위 단일 작업은 File Tree, 대량 데이터 정제는 Consolidation Pipeline이 최적인 구조임
실천 포인트
1. 에이전트 수와 세션 길이에 따른 Load Shape 정의
2. State 유지 방식(Log vs DB vs Prompt)의 Trade-off 분석
3. 데이터 무한 증식 방지를 위한 Confidence Decay 또는 Truncation 전략 수립
4. Prompt Cache 활용도를 높이기 위한 Prompt Prefix 최적화 검토