피드로 돌아가기
Dev.toAI/ML
원문 읽기
인간 뇌의 4대 기억 체계 모사로 Context Tax를 제거한 Hermes Agent 아키텍처
Hermes Agent Has Four Memories — And That's Why It Doesn't Forget You
AI 요약
Context
기존 LLM 에이전트는 거대 Context Window나 Vector DB에 의존하여 세션 간 기억 유지 및 정체성 보존에 한계를 보임. 이는 매 세션마다 동일한 컨텍스트를 반복 주입해야 하는 Context Tax 발생과 정체성 드리프트 현상으로 이어짐.
Technical Solution
- SOUL.md를 통한 Identity 레이어 분리로 모델의 기본 페르소나와 제약 사항을 고정하는 substrate 설계
- USER.md(사용자 모델)와 MEMORY.md(세계관/사실)를 분리한 Semantic Memory 구현으로 동적 정보 업데이트 최적화
- SKILL.md 단위의 파일 시스템 기반 Procedural Memory 구축을 통한 도구 사용 및 실행 절차의 모듈화
- SQLite 및 FTS5 기반의 Session 저장소를 통한 Episodic Memory 구현으로 과거 대화 내용의 효율적 검색 및 복원
- Curator 기능을 통한 정기적 데이터 정리 및 통합 과정을 설계하여 인간의 수면 단계와 유사한 Memory Consolidation 수행
- Progressive Disclosure 전략을 적용하여 필요한 시점에만 특정 기억 레이어를 로드함으로써 Token 비용 및 추론 효율성 개선
실천 포인트
1. 에이전트의 정체성(Identity)과 가변적 사실(Facts)을 분리하여 저장하고 있는가?
2. 단순 검색(Retrieval)이 아닌 절차적 지식(Procedural Knowledge)을 위한 독립된 모듈이 존재하는가?
3. 누적된 컨텍스트를 정제하고 압축하는 Consolidation 프로세스가 스케줄링되어 있는가?
4. 토큰 최적화를 위해 정보의 중요도에 따른 단계적 노출(Progressive Disclosure) 전략을 채택했는가?