피드로 돌아가기
InfoQInfoQ
AI/ML

Context Rot 해결을 위한 Multi-channel Retrieval 기반 Managed Memory 설계

Cloudflare Announces Agent Memory, a Managed Persistent Memory Service for AI Agents

Steef-Jan Wiggers2026년 4월 30일4advanced

Context

Context Window 확장에도 불구하고 토큰 증가에 따라 출력 품질이 저하되는 Context Rot 현상이 발생함. 단순한 전체 데이터 주입 방식은 품질 저하와 정보 손실 사이의 Trade-off를 유발하여 효율적인 Memory 관리 체계가 요구됨.

Technical Solution

  • SHA-256 ID 부여를 통한 Idempotent Re-ingestion 구조 설계로 데이터 중복 처리
  • 10K 문자 단위 Broad Pass와 구체적 값 중심 Detail Pass의 Parallel Extraction으로 정보 밀도 최적화
  • 8단계 Verification 후 Facts, Events, Instructions, Tasks의 4종 분류 및 Topic 기반 정규화 저장
  • Full-text, Fact-key, Vector, HyDE 등 5개 채널의 병렬 검색 결과를 Reciprocal Rank Fusion(RRF)으로 통합
  • Llama 4 Scout(17B MoE)를 통한 추출 및 Nemotron 3(120B MoE)를 활용한 Synthesis 단계의 모델 분리 최적화
  • Durable Objects 및 Vectorize 통합을 통한 Edge 기반의 Shared Memory Profile 아키텍처 구현

- Context Window의 60% 도달 시점에서 선제적 Compaction 트리거 설정 - 대화 기록(History)과 학습된 사실(Learned Facts)의 저장소 분리 설계 - 핵심 데이터의 경우 자동 Ingestion에 의존하지 않고 명시적 Remember Tool 호출 적용 - 단순 Vector Search 외에 HyDE 등 보완적 Retrieval 채널 구축 검토

원문 읽기