피드로 돌아가기
Anthropic Is Preparing for IPO and We Should Be Worried
Hacker NewsHacker News
AI/ML

컴퓨팅 리소스 최적화 및 수익화를 위한 Claude API 과금 체계 분리

Anthropic Is Preparing for IPO and We Should Be Worried

2026년 5월 19일5intermediate

Context

Flat-rate 구독 기반의 무제한성 접근으로 인한 Compute 및 Engineering 리소스의 과도한 소모 발생. 특히 제3자 에이전트 프레임워크를 통한 API 호출 급증으로 시스템 부하가 임계치에 도달한 상황.

Technical Solution

  • 인터랙티브 세션과 자동화 워크플로우의 트래픽을 분리하는 Dual-Bucket 과금 아키텍처 도입
  • claude -p 및 Agent SDK 사용량을 일반 구독 한도에서 제외하고 별도의 Agent SDK Credit 체계로 전환
  • Credit 소진 시 표준 API Rate 기반의 Usage-based Billing으로 자동 전환되는 Fallback 메커니즘 설계
  • 제3자 하네스(OpenCode, Pi 등)의 구독 접근을 차단하여 플랫폼 전용 인터페이스로의 트래픽 유도
  • Reasoning Effort 수준을 High에서 Medium으로 조정하여 추론 비용 및 Latency 최적화 시도
  • SpaceX Colossus 1 데이터센터의 220,000개 GPU 인프라 확보를 통한 대규모 연산 처리 능력 확장

- API 제공 시 사용자의 인터페이스(UI vs CLI/SDK)별로 Quota를 분리하여 설정했는가? - 무제한 플랜 제공 시 특정 워크로드(Automation/Agent)가 전체 리소스를 점유하는 병목 지점을 식별했는가? - 추론 비용 절감을 위해 모델의 Reasoning Level을 동적으로 조정하는 제어 장치를 마련했는가?

원문 읽기