피드로 돌아가기
GeekNewsAI/ML
원문 읽기
Memora: 장기 작업을 위한 확장형 메모리 시스템
원문 보존과 검색 추상화 분리로 RAG의 정보 손실을 해결한 확장형 메모리 시스템
AI 요약
Context
단순 Chunking 기반 RAG의 문맥 분절 및 의미적 잡음으로 인한 검색 정확도 저하 발생. 그래프 DB의 엄격한 스키마 관리 부담과 요약 저장 시의 세부 정보 손실이라는 Trade-off 존재.
Technical Solution
- Memory value, Primary abstraction, Cue anchors로 구성된 3계층 저장 구조를 통한 원문 보존과 검색 효율의 분리
- Primary abstraction을 메모리 식별 및 중복 제거의 표준 단위로 활용하여 데이터 무제한 증식 억제
- Cue anchors의 다대다 매핑 구조 설계를 통한 다각도 의미적 접근 경로 확보
- Semantic, Hybrid, Prompted, GRPO 등 질문 복잡도에 따른 적응형 검색 전략의 계층적 적용
- ChromaDB 및 Redis 기반의 Storage Agnostic 설계를 통한 인프라 종속성 제거
- GRPO 강화학습 기반 검색 정책 최적화로 LLM 호출 비용 감소 및 도메인 특화 검색 경로 학습
실천 포인트
1. 원문 임베딩 전 대표 요약(Abstraction)과 검색 단서(Cue)를 생성하는 파이프라인 구축 검토
2. 질문의 난이도에 따라 단순 Vector Search와 LLM 기반 Iterative Search를 분기하는 라우팅 로직 적용
3. 메모리 누적 방지를 위해 Primary abstraction 기준의 중복 제거 및 병합 프로세스 정의
4. 다중 에이전트 환경 도입 시 공유 메모리 영역과 격리 영역의 접근 제어 정책 수립