피드로 돌아가기
Introducing LLM Cost Tracking in Pingoni: See Your OpenAI Spend Per User in 5 Minutes
Dev.toDev.to
Backend

5분 내 통합 가능한 OpenAI 비용 추적 및 다차원 분석 시스템 구현

Introducing LLM Cost Tracking in Pingoni: See Your OpenAI Spend Per User in 5 Minutes

Ayo2026년 5월 19일7intermediate

Context

LLM API 도입 후 실시간 비용 가시성 부족으로 인한 예산 초과 위험 발생. 기존 솔루션은 고가의 엔터프라이즈 플랫폼이거나 복잡한 인프라 운영이 필요한 오픈소스 위주로 구성되어 소규모 팀의 진입 장벽이 높음.

Technical Solution

  • Fire-and-forget 방식의 SDK 설계를 통한 API 응답 지연 및 애플리케이션 크래시 원천 차단
  • 클라이언트 사이드에서 단순 Usage 데이터만 전송하고 서버 사이드에서 최신 모델별 Pricing Table을 기반으로 비용을 계산하는 아키텍처 채택
  • UserID 및 Feature 태그를 통한 다차원 Attribution 구조를 설계하여 개별 사용자 및 기능별 비용 집계 구현
  • 기존 API 모니터링 SDK와 통합하여 추가 설정 없이 단일 대시보드에서 Latency, Error, Cost를 통합 관리
  • OpenAI의 16종 모델을 포함한 시딩 데이터를 통해 실시간 비용 산출 로직 구현

- LLM 비용 추적 시 Pricing Table을 서버에서 관리하여 클라이언트 업데이트 없이 가격 변동에 대응할 것 - 모니터링 로직은 메인 비즈니스 흐름에 영향을 주지 않도록 비동기/Non-blocking 방식으로 구현할 것 - 단순 합계가 아닌 User/Feature 단위의 태그 기반 추적을 통해 비용 최적화 대상(Heavy User, 고비용 기능)을 식별할 것

원문 읽기