피드로 돌아가기
Your AI bill is out of control. Cloudflare can fix it now.
Cloudflare BlogCloudflare Blog
Infrastructure

AI Gateway 기반 Identity 기반 비용 제어 및 Dynamic Routing 체계 구축

Your AI bill is out of control. Cloudflare can fix it now.

Kenny Johnson2026년 6월 5일7intermediate

Context

공용 API Key 사용으로 인한 개별 사용자 및 팀 단위 비용 추적 불가 상황 발생. 작업 복잡도와 무관하게 최상위 모델을 사용하는 기본 설정으로 인해 불필요한 Token 비용 급증 및 ROI 측정 한계 직면.

Technical Solution

  • 애플리케이션과 AI Provider 사이에 AI Gateway를 배치한 Proxy 아키텍처 설계
  • Token 기반 제한을 넘어 달러($) 단위의 실시간 누적 비용을 추적하는 Spend Limits 로직 구현
  • Cloudflare Access의 JWT에서 사용자 신원을 추출하여 Request 메타데이터에 결합하는 Identity-driven Attribution 방식 채택
  • 예산 소진 시 Request를 차단하거나 Dynamic Routes를 통해 저비용 Fallback 모델로 자동 전환하는 트래픽 제어 메커니즘 적용
  • 모델, 제공자, 사용자, 팀 등 다차원 속성(Custom Attributes)에 따른 유연한 Budget 스코핑 구조 설계
  • 작업 특성에 따라 최적 모델로 자동 배정하는 Task-based Routing 엔진 개발 중

- AI API 호출 경로에 Proxy 계층을 두어 가시성 및 제어권 확보 검토 - 단순 Rate Limit가 아닌 실제 비용 기반의 Budgeting 시스템 설계 적용 - JWT 기반 신원 정보를 Request 메타데이터에 바인딩하여 비용 귀속(Attribution) 체계 구축 - Critical Path가 아닌 작업에 대해 Fallback 모델로 전환하는 Dynamic Routing 전략 수립

원문 읽기