피드로 돌아가기
I built persistent AI memory for Claude on Cloudflare's free tier
Dev.toDev.to
AI/ML

Cloudflare Free Tier 기반의 Persistent AI Memory 아키텍처 구현

I built persistent AI memory for Claude on Cloudflare's free tier

Rahil Pirani2026년 5월 20일2intermediate

Context

LLM 세션별 컨텍스트 초기화로 인한 반복적 정보 입력의 비효율성 발생. 세션 간 기억을 유지하는 Persistent Memory 시스템의 필요성 증대.

Technical Solution

  • Cloudflare Workers 및 D1(SQLite), Vectorize를 결합한 Serverless MCP 아키텍처 설계
  • Cosine Similarity의 한계를 극복하기 위해 태그별 Half-life를 적용한 Time-decay Reranking 로직 구현
  • 데이터 중복 방지를 위해 Embedding 벡터 유사도 95% 이상 시 저장 차단하는 Deduplication 필터 적용
  • 200자 Overlap 기반의 Smart Chunking으로 정보 손실을 최소화하고 D1-Vectorize 간 ID 매핑을 통한 정밀한 데이터 삭제 제어
  • @cf/meta/llama-4-scout-17b-16e-instruct 모델을 통한 Web UI 내 실시간 답변 합성 및 스트리밍 처리

1. 벡터 유사도 검색 시 최신성 반영을 위한 시간 감쇠(Time-decay) 함수 도입 검토

2. 데이터 저장 전 벡터 유사도 임계치 기반의 중복 체크 단계 추가

3. Chunking 전략 수립 시 문맥 보존을 위한 Overlap 구간 설정 및 메타데이터 매핑 구조 설계

원문 읽기