피드로 돌아가기
Anthropic tosses agents into the API billing pool
The RegisterThe Register
AI/ML

Interactive와 Programmatic 사용량 분리를 통한 Token 비용 최적화 및 API 전환 유도

Anthropic tosses agents into the API billing pool

2026년 5월 14일3intermediate

Context

Flat-rate 구독 모델의 무제한 Token 소비로 인한 인프라 비용 증가와 수익성 악화 발생. 특히 OpenClaw와 같은 Agent 플랫폼을 통한 고부하 Token 소모 작업이 추론 자원 공급량을 초과하는 병목 지점 형성.

Technical Solution

  • User-in-the-loop 기반의 Interactive Use와 Headless/SDK 기반의 Programmatic Use로 사용 경로를 이원화한 설계
  • 구독료 기반의 Credit을 Programmatic 전용 Pool로 할당하여 무제한 사용을 차단하는 Rate Limit 구조 도입
  • Credit 소진 후 'Extra Usage' 설정을 통한 서비스 중단 방지 및 비용 상한선 제어 메커니즘 구현
  • Third-party Harness 사용 금지 정책 강화를 통한 API Metered Billing 체계로의 강제 전환 유도
  • 미사용 Credit의 이월(Roll-over)을 배제하여 매월 고정된 비용 효율성을 유지하는 정산 로직 적용

- 서비스 모델 설계 시 무제한 플랜의 남용을 막기 위한 사용 패턴별(Interactive vs Programmatic) 쿼터 분리 검토 - API 기반 서비스에서 갑작스러운 서비스 차단을 방지하기 위한 'Extra Usage'와 같은 유연한 Fallback 빌링 옵션 설계 - 인프라 공급량과 수요의 불균형 발생 시, 정책적 제약을 통해 고비용 사용자를 유료 API 체계로 유도하는 전략 수립

원문 읽기