피드로 돌아가기
Dev.toBackend
원문 읽기
How to Track AI API Costs Per Customer With One API Call
Tanso가 단일 API 호출로 AI API 비용을 고객 및 기능별로 실시간 추적하는 이벤트 기반 시스템 제공
AI 요약
Context
AI API를 사용하는 애플리케이션에서 OpenAI, Anthropic, Cohere 등 여러 공급자의 비용이 각각 다르게 청구되며, 월별 인보이스 수준의 집계 데이터만 존재해 고객별·기능별 원가를 파악하는 데 하루 이상이 소요되었다. 모델 가격 변동이나 고객 사용량 급증 시 특정 기능의 마진이 음수인지 즉시 알 수 없어 비용 최적화가 불가능했다.
Technical Solution
- 단일 이벤트 기반 비용 추적: AI API 응답 직후
POST /api/v1/client/events엔드포인트로 고객ID, 기능키, 비용, 사용량을 전송 - 멱등성 보장:
eventIdempotencyKey필드로 중복 네트워크 재시도 시 자동 중복 제거 - 실시간 집계: 전송된 이벤트를 고객별·기능별로 실시간 집계하여 대시보드에 반영
- 플랜 한도 관리:
POST /api/v1/client/entitlements/checkAPI로 고객의 현재 사용량과 플랜 한도를 실시간 조회하여 접근 제어 - Stripe 자동 동기화: 수집된 이벤트가 Stripe Billing Meters를 거쳐 자동으로 다음 청구서에 반영
- 다중 배포 환경 지원: HTTP POST 기반 API로 백엔드, 터미널 curl, Claude Code 같은 AI 에이전트에서 직접 호출 가능
Key Takeaway
AI 비용 추적은 청구서 후처리가 아닌 API 호출 시점의 이벤트 기반 계측으로 접근하면, 배치 작업 없이 고객별·기능별 원가와 마진을 실시간으로 파악할 수 있으며, 이를 기반으로 플랜 강제와 청구 자동화까지 하나의 데이터 구조로 통합할 수 있다.
실천 포인트
OpenAI, Anthropic 등 여러 AI API를 호출하는 SaaS 백엔드에서 각 호출 직후 고객ID·기능명·비용·토큰 수를 담은 단일 POST 요청을 Tanso로 전송하면, 쿼리 하나로 고객별 원가와 마진 여부를 확인할 수 있으며, 추가 ETL이나 청구 로직 개발 없이 Stripe 인보이싱까지 자동화된다.