피드로 돌아가기
Dev.toAI/ML
원문 읽기
Cloudflare Free Tier 기반의 Persistent AI Memory 아키텍처 구현
I built persistent AI memory for Claude on Cloudflare's free tier
AI 요약
Context
LLM 세션별 컨텍스트 초기화로 인한 반복적 정보 입력의 비효율성 발생. 세션 간 기억을 유지하는 Persistent Memory 시스템의 필요성 증대.
Technical Solution
- Cloudflare Workers 및 D1(SQLite), Vectorize를 결합한 Serverless MCP 아키텍처 설계
- Cosine Similarity의 한계를 극복하기 위해 태그별 Half-life를 적용한 Time-decay Reranking 로직 구현
- 데이터 중복 방지를 위해 Embedding 벡터 유사도 95% 이상 시 저장 차단하는 Deduplication 필터 적용
- 200자 Overlap 기반의 Smart Chunking으로 정보 손실을 최소화하고 D1-Vectorize 간 ID 매핑을 통한 정밀한 데이터 삭제 제어
- @cf/meta/llama-4-scout-17b-16e-instruct 모델을 통한 Web UI 내 실시간 답변 합성 및 스트리밍 처리
실천 포인트
1. 벡터 유사도 검색 시 최신성 반영을 위한 시간 감쇠(Time-decay) 함수 도입 검토
2. 데이터 저장 전 벡터 유사도 임계치 기반의 중복 체크 단계 추가
3. Chunking 전략 수립 시 문맥 보존을 위한 Overlap 구간 설정 및 메타데이터 매핑 구조 설계