피드로 돌아가기
Dev.toAI/ML
원문 읽기
Wrapper 기반 LLM 비용 Attribution 시스템 구축으로 기능별 정밀 비용 추적 실현
Como Rastrear Gastos da API OpenAI por Funcionalidade: Guia de Atribuição de Custos
AI 요약
Context
OpenAI 기본 Billing 대시보드가 조직 단위의 총액만 제공하여 특정 기능, 고객, API Route별 비용 분석이 불가능한 한계 발생. 모델 사용량의 세부 Attribution 부재로 인한 B2B 고객별 마진 계산 및 비효율적 기능의 비용 최적화 난항.
Technical Solution
- SDK 직접 호출을 금지하고 모든 요청을 처리하는 전용 Wrapper 계층 설계
- 요청 시 feature, route, customer_id, environment 등 메타데이터 강제 주입 구조 채택
- response.usage의 prompt, completion, reasoning, cached tokens를 활용한 실시간 cost_usd 계산 로직 구현
- 가격 변동에 따른 데이터 왜곡 방지를 위해 쿼리 시점이 아닌 기록 시점에 단가를 확정하는 스냅샷 방식 적용
- request_id를 통한 Idempotency 보장 및 중복 과금 방지를 위한 데이터 Warehouse 적재 파이프라인 구성
- Reasoning tokens를 Output 비용으로 합산 처리하여 Thinking 모드 사용 시의 비용 저평가 문제 해결
실천 포인트
- LLM SDK 호출부를 중앙 집중화한 Wrapper 클래스 구현 여부 확인 - 요청-응답 사이클에 customer_id 및 feature 태그 포함 여부 검토 - Pricing Table을 코드 내 혹은 설정 파일로 관리하여 실시간 비용 계산 로직 적용 - Reasoning tokens 포함 여부를 확인하여 실제 청구 금액과 일치하는지 검증 - 분석용 Data Warehouse에 request_id 기반의 구조화된 JSON 로그 적재 체계 구축