피드로 돌아가기
Token Budget Negotiator
Dev.toDev.to
AI/ML

Greedy Ablation 기반 프롬프트 최적화로 토큰 44.1% 절감 및 품질 유지

Token Budget Negotiator

Nilofer 🚀2026년 4월 27일7intermediate

Context

프롬프트 구성 요소의 누적으로 인한 API 비용 증가 및 토큰 낭비 발생. 각 섹션의 기여도를 정량적으로 판단할 기준이 부재하여 수동 트림 방식의 불확실성과 비효율성에 직면.

Technical Solution

  • YAML 기반의 구조화된 프롬프트 정의를 통한 Section별 Priority 및 Type 관리
  • Judge LLM과 Rubric을 활용한 Baseline Score 측정 및 품질 하한선(Threshold) 설정
  • 낮은 우선순위 섹션부터 순차적으로 제거하는 Greedy Ablation Loop 설계
  • 제거 후 재점수화 과정을 통해 Quality Retention 비율이 임계치 이상인 경우에만 영구 제거 수행
  • min_token_savings 및 max_token_savings 제약 조건을 통한 최적화 범위 제어
  • ScoreCache 및 SectionTokenizer 도입을 통한 중복 계산 방지 및 정확한 토큰 카운팅 구현

1. 프롬프트를 기능별 섹션으로 분리하고 우선순위 부여

2. 정답셋과 평가 기준이 명시된 Rubric 정의

3. 품질 하한선(예:

0.8~

0.9)을 설정하여 Greedy 제거 루프 적용

4. 로컬 LLM(Ollama 등)을 활용한 비용 효율적인 평가 파이프라인 구축

원문 읽기