피드로 돌아가기
I Cut My Claude Code Token Usage by 94% With This Open Source Tool
Dev.toDev.to
AI/ML

Hybrid Retrieval 기반 CCE 도입으로 Claude Code 토큰 소모량 94% 절감

I Cut My Claude Code Token Usage by 94% With This Open Source Tool

Raj2026년 5월 7일3intermediate

Context

AI 코딩 도구의 세션별 전체 코드베이스 재판독으로 인한 과도한 Input Token 낭비 발생. 필요한 컨텍스트 외의 불필요한 파일 전체를 읽어 들이는 비효율적인 컨텍스트 주입 구조의 한계점 존재.

Technical Solution

  • Tree-sitter 기반 Semantic Chunking을 통한 함수 및 클래스 단위의 정밀한 코드 분할
  • Vector Similarity와 BM25 Keyword Matching을 결합한 Hybrid Retrieval 구조 설계로 검색 정확도 향상
  • CALLS 및 IMPORTS 엣지를 추적하는 Graph Expansion 적용을 통한 연관 코드 컨텍스트 확장
  • Signature 및 Docstring 위주의 Compression 기법을 통한 전송 데이터 크기 최소화
  • Local MCP Server 기반의 에디터 agnostic 아키텍처 설계로 데이터 프라이버시 확보 및 범용성 제공
  • Embedding Cache Hit Rate 96% 달성으로 수정 사항 반영 시 1초 미만의 Re-indexing 속도 구현

- LLM 기반 도구 도입 시 Full-file Read 방식의 토큰 비용 시뮬레이션 수행 - 코드 분석 시 단순 텍스트 분할이 아닌 AST 기반의 Semantic Chunking 적용 검토 - 정밀한 컨텍스트 추출을 위해 Vector Search와 Keyword Search의 Hybrid 전략 채택 - 빈번한 업데이트가 발생하는 코드베이스를 위해 Embedding Cache 전략 수립

원문 읽기