피드로 돌아가기
Dev.toAI/ML
원문 읽기
Claude Code 세션 로그 분석을 통한 API 비용 최적화 구조 설계
Optimizing your Claude Code usage (and spending less $$)
AI 요약
Context
AI 모델 제공사의 API Token Limit 강화로 인한 비용 상승 압박 가중. 사용자가 각 프로젝트 및 세션별 Token 소모량을 정밀하게 추적할 수 없는 가시성 부족 문제 발생.
Technical Solution
- Claude Code가 로컬에 생성하는 JSONL 로그 파일을 데이터 소스로 활용한 분석 파이프라인 구축
- 대량의 로그 데이터를 효율적으로 쿼리하기 위해 로컬 DuckDB 기반의 저장소 계층 설계
- 최대 30일치 세션 로그를 DuckDB로 Backfill 하여 시계열 분석 환경 조성
- 입력/출력 길이 및 Tool Call 횟수를 기준으로 소형 모델로 대체 가능한 Workload 패턴 식별 로직 구현
- 설정된 예산 대비 현재 소모량을 계산하여 잔여 가능 기간을 산출하는 Projection 알고리즘 적용
실천 포인트
- LLM API 비용 최적화를 위해 세션별 Token 사용량 가시성 확보 - Workload 특성(입출력 길이, Tool 사용 빈도)에 따른 모델 Tiering 전략 검토 - 로컬 로그 데이터를 DuckDB와 같은 경량 분석 DB로 구조화하여 비용 분석 자동화