피드로 돌아가기
Dev.toBackend
원문 읽기
Claude Code 스킬로 Groq, OpenAI, Gemini, MiniMax의 무료 티어를 자동 분류·라우팅해 월별 한도 초과 없이 관리
I Built a Skill So Claude Automatically Routes Tasks to Free-Tier AI Providers
AI 요약
Context
다중 무료 AI API 제공자(Groq, OpenAI, Gemini, MiniMax)에 대한 접근 권한이 있지만 수동 관리로 인해 잘못된 도구 선택, 예상치 못한 한도 소진, 사용량 가시성 부족이 발생했다.
Technical Solution
- 작업 분류 기반 라우팅: 작업 유형(코드 작성/연구/창작/즉답)을 먼저 분류한 후 최적 제공자(Codex/Gemini/MiniMax/Groq)로 자동 라우팅
- 한도 추적: router.py가 usage.json의 토큰 예산을 확인하고 API 호출 전에 최적 제공자 선택
- 자동 폴백: 제공자의 무료 티어가 10% 이하로 떨어지면 자동으로 폴백 제공자(Groq→Gemini, Codex→Groq, Gemini→MiniMax, MiniMax→Gemini)로 전환
- 실시간 상태바: 모든 응답 앞에 각 제공자의 사용량 현황 표시(초록/노랑/빨강/회색 상태 표시)
- 원자적 쓰기: usage.json 업데이트 시 .tmp + rename으로 부분 쓰기 방지
- 자동 리셋: UTC 자정에 일일 한도 초기화, 매월 1일에 월간 한도 초기화
Key Takeaway
여러 API 제공자를 사용할 때 분류 기반 라우팅과 실시간 한도 추적을 오케스트레이터 에이전트에 맡기면 수동 관리 오버헤드를 제거하고 한도 초과를 원천 차단할 수 있다.
실천 포인트
다중 무료 API 제공자를 운영하는 개발팀에서 작업 유형을 먼저 분류한 후 제공자를 선택하는 라우팅 레이어를 도입하면, 각 API의 일일/월간 한도를 정확히 추적하고 한 제공자의 한도 소진 시 자동으로 대체 제공자로 전환할 수 있다.