피드로 돌아가기
I expected the cheaper model to be cheaper. It cost 8.6 more.
Dev.toDev.to
Backend

결제 시스템 설계 기반 LLM Gateway 구축으로 비용 8.6배 폭증 방지 및 안정성 확보

I expected the cheaper model to be cheaper. It cost 8.6 more.

Yogesh230120012026년 6월 13일4intermediate

Context

LLM API를 단순 외부 의존성으로 취급하여 발생하는 비용 예측 불가능성과 시스템 불안정성 해결 필요. 특히 Thinking Model의 내부 추론 토큰 발생으로 인한 예상치 못한 비용 증가 사례 발생.

Technical Solution

  • Payment 시스템의 Audit Log 개념을 도입하여 모든 API 호출의 토큰 및 비용을 Postgres에 실시간 기록하는 Metering 구조 설계
  • 모델 제공자의 상태 변화에 대응하기 위해 CLOSED, OPEN, HALF_OPEN 상태를 가지는 Circuit Breaker를 적용하여 Cascading Failure 방지
  • 중복 과금 및 중복 요청 방지를 위해 Request_id 기반의 Idempotency 키를 적용한 비용 로그 저장 로직 구현
  • 비용 데이터의 정밀도 보장을 위해 Float 대신 NUMERIC 타입을 사용하여 부동 소수점 오차 제거
  • 일시적 오류와 지속적 장애를 구분하여 Idempotent Retry와 Circuit Breaker를 조합한 Fault-tolerant 워크플로우 구축

- LLM API 호출 시 토큰 사용량과 비용을 추적하는 전용 Metering 레이어 구축 - 모델 제공자별 SLA를 고려한 Circuit Breaker 및 Rate Limiter 설정 - 비용 계산 시 반드시 Fixed-precision 데이터 타입 사용 - Idempotency 키를 활용한 API 재시도 전략 수립

원문 읽기