피드로 돌아가기
I built a local AI memory gate on a CPU, and my 7B model scored worse than my 1.5B model because it was too smart
Dev.toDev.to
AI/ML

CPU 기반 HDC 및 SQLite 활용 오프라인 AI 메모리 레이어 구현

I built a local AI memory gate on a CPU, and my 7B model scored worse than my 1.5B model because it was too smart

Roan de Jager2026년 6월 22일2advanced

Context

Neural Vector Database 운용에 따른 고비용의 VRAM 소모와 연산 오버헤드 해결 필요성 대두. 완전히 오프라인 환경에서 작동하는 경량 메모리 계층 구축을 통한 로컬 LLM 최적화 시도.

Technical Solution

  • SQLite 기반의 Subject-Predicate-Object 트리플 구조를 통한 상징적 Ground Truth 데이터 저장
  • Hebbian Plasticity 원리를 적용하여 대화 중 개념 동시 발생 빈도를 추적하는 가중치 기반 연상 메모리 설계
  • 10,000차원의 Leaky Context Vector를 활용한 Hyperdimensional Computing(HDC) 구조로 대명사 해결 및 Hallucination 방지
  • VSA(Vector Symbolic Architectures) 기반의 Context-binding 연산을 통한 이력 누적 및 쿼리 필터링 로직 구현
  • Consumer Hardware의 CPU 환경에서 구동 가능한 순수 Python 기반의 비신경망(Gradient-free) 아키텍처 채택

1. Vector DB의 VRAM 부하가 클 경우 HDC나 상징적 DB(SQLite)를 활용한 하이브리드 메모리 구조 검토

2. 모델 업그레이드 후 벤치마크 점수 하락 시, 정답 데이터의 Exact Match 여부와 모델의 표현 방식 차이 분석

3. 로컬 환경의 리소스 제약 상황에서 Gradient-free associative weights를 통한 경량 컨텍스트 관리 적용

원문 읽기