피드로 돌아가기
Dev.toAI/ML
원문 읽기
Vector Similarity 한계를 극복한 AI Agent Memory 설계 전략
Your AI agent remembers what sounds related, not what worked
AI 요약
Context
단순 Vector Similarity 기반의 RAG 구조는 의미적 유사성만 파악할 뿐 실제 성공 여부를 판단하지 못하는 한계 존재. 이로 인해 Agent가 과거의 실패 경로를 반복해서 선택하는 루프 현상이 발생함.
Technical Solution
- Vector Store 단독 사용을 지양하고 Failure Log를 분리하여 유사도 검색 전 우선 참조하는 계층적 구조 설계
- Task 종료 후 Post-mortem 작성 프로세스를 도입하여 단순 사건이 아닌 '교훈' 중심의 데이터 저장
- raw event(사실)와 lesson(해석)을 분리 저장하여 시스템 변경 시 해석만 유연하게 수정 가능한 구조 채택
- 신뢰 수준에 따라 Stable Facts와 일반 메모리를 구분하는 Memory Tiering 적용
- 단순 데이터 축적으로 인한 Noise 증가를 방지하기 위한 주기적 Summary 단계 추가
실천 포인트
- Vector Similarity 검색 결과에 의존하지 말고 Failure Log 우선 조회 로직 구현 검토 - 메모리 저장 시 '발생한 사건'과 '도출된 결론'을 별도 필드로 분리하여 저장 - 특정 행동이 Rule로 승격되기 전 검증 단계(Human-in-the-loop 또는 다중 검증) 배치 - 시스템 리팩토링 시 기존 학습된 Lesson의 유효성을 재검토하는 Cleanup 프로세스 수립