피드로 돌아가기
I Built a Zero-Markup AI API Gateway - 18 Models at Provider Cost
Dev.toDev.to
Infrastructure

New API 기반 Zero-Markup AI Gateway로 18종 모델 비용 최적화

I Built a Zero-Markup AI API Gateway - 18 Models at Provider Cost

LYX199511212026년 6월 14일1intermediate

Context

기존 AI API Gateway 서비스들의 불투명한 마진 책정으로 인한 추가 비용 발생 문제. 제공업체의 원가와 사용자 청구 금액 간의 괴리로 인한 비용 효율성 저하 상황.

Technical Solution

  • New API 오픈소스 프로젝트 포크를 통한 기본 인프라 확보 및 확장
  • OpenAI Compatible 인터페이스 적용으로 클라이언트 사이드 코드 변경 최소화
  • Markup 설정값 0으로 고정한 Zero-Markup 프라이싱 엔진 구현
  • DeepSeek, Claude, Qwen 등 18종의 이종 모델을 단일 Endpoint로 통합 관리
  • 기업 고객 대상 SSO, SLA, 전용 인프라 제공을 통한 서비스 지속 가능성 확보 모델 설계

Impact

  • DeepSeek V4 Flash 기준 Input $0.10/1M, Output $0.20/1M의 원가 적용
  • Qwen 3.7 Max 기준 Input $1.25/1M, Output $3.75/1M의 원가 적용
  • 가입 시 $5 크레딧 제공을 통한 진입 장벽 제거

Key Takeaway

오픈소스 기반의 검증된 프레임워크를 활용하여 비즈니스 로직(Pricing)만 변경함으로써 빠르게 시장 가치를 검증한 사례.


1. API Gateway 도입 시 벤더사의 숨겨진 마진 구조 및 실제 Provider 원가 대조

2. 다양한 LLM 사용 시 OpenAI Compatible API 표준 준수 여부 확인을 통한 전환 비용 절감

3. B2C 무료 제공과 B2B 부가 기능(SSO, SLA) 유료화를 결합한 하이브리드 수익 모델 검토

원문 읽기