실패 경로 조기 차단을 통한 LLM 토큰 비용 28~64% 절감

BAGEN: LLM Agents Waste 44% of Tokens on Tasks They'll Fail

Jangwook Kim2026년 6월 5일13분intermediate

AI 요약

Context

LLM Agent의 max_tokens 설정은 단순 임계치 제한으로 작동하여 실패가 확정된 경로에서도 한계치까지 토큰을 소모하는 자원 낭비 구조 설계. Task 성능과 Resource 예측 능력 간 낮은 상관관계(r=0.35)로 인한 Frontier 모델들의 과도한 낙관적 편향 발생.

Technical Solution

Feasibility Prediction 도입을 통한 작업 시작 전 실행 가능성 사전 판별 시도
Rollout-replay 프로토콜 기반의 중간 단계별 예산 추정 및 실패 신호 감지 로직 설계
단일 예측값 대신 Lower/Upper Bound를 정의하는 Interval Calibration 방식 적용
단순 Hard Limit 대신 Per-step 비용 추세와 분산을 모니터링하는 Wrapper 레벨의 Soft Signal 체계 구축
Task 완수 최적화가 아닌 실패 지점 예측을 위한 별도의 진단 루프 분리

실천 포인트

1. Agent 루프에 Per-step 토큰 소모량 모니터링 및 분산 분석 로직 추가

2. 단순 Token Limit 설정 외에 Backtracking 패턴 감지 시 조기 종료 트리거 검토

3. Task 시작 전 리소스 예측 인터벌을 설정하여 예산 초과 가능성 사전 알림 구현

4. 실패한 Trajectory의 토큰 소모 패턴을 분석하여 Early Stopping 임계치 최적화

태그

#Early Stopping #LLM-Agents #Interval Estimation #Token Budgeting #Resource-Optimization

원문 읽기