피드로 돌아가기
I built ctxstash: pack a codebase into one LLM-ready file, with a token count
Dev.toDev.to
DevOps

Zero-dependency 기반 LLM Context 최적화 패킹 도구 ctxstash 구현

I built ctxstash: pack a codebase into one LLM-ready file, with a token count

benjamin2026년 6월 13일4intermediate

Context

LLM 활용 시 다수 파일의 수동 복사-붙여넣기로 인한 컨텍스트 구조 파괴와 토큰 제한 예측 불가능성 발생. 외부 서버 전송 방식의 보안 리스크 및 Python 전용 도구의 생태계 제약으로 인한 범용적 솔루션 필요성 증대.

Technical Solution

  • Node.js 및 Python 기반의 Zero-dependency 아키텍처 설계로 서플라이 체인 리스크 제거 및 즉각적인 실행 환경 구축
  • 4 chars/token 기준의 Tokenizer-agnostic 추정 로직 도입을 통한 LLM 입력 가능 여부 사전 판단
  • NUL 바이트 및 Control-byte 밀도 분석 기반의 Binary Sniffing 기법 적용으로 확장자 기반 필터링의 한계 극복
  • Markdown 문서 내 코드 펜스 충돌 방지를 위한 가변 길이 펜싱(Collision-safe fences) 전략 채택
  • 표준 출력(stdout)과 표준 에러(stderr)의 분리를 통한 데이터 스트림과 메타데이터 출력 경로 최적화
  • 교차 언어 구현체 간의 바이트 단위 동일성 검증 테스트 수행으로 일관된 출력 결과 보장

1. LLM 컨텍스트 구성 시 파일 트리 구조를 상단에 배치하여 모델의 공간적 이해도 제고

2. 정밀한 Tokenizer 도입 전 단계에서 단순 문자열 길이 기반의 근사치 추정으로 개발 생산성 확보

3. 바이너리 파일 제외 로직 설계 시 확장자 외에 파일 내부 바이트 패턴 분석 병행 검토

4. 다중 런타임 지원 도구 개발 시 입력값에 따른 출력 결과의 결정론적 일치성(Deterministic output) 검증

원문 읽기