피드로 돌아가기
OpenAI floats buy-before-your-try AI availability guarantee
The RegisterThe Register
Infrastructure

인프라 부족 해결을 위한 OpenAI의 Guaranteed Capacity 도입

OpenAI floats buy-before-your-try AI availability guarantee

2026년 5월 20일3intermediate

Context

Flat-rate 구독 모델로 인한 수요 폭증과 Datacenter Inference Capacity의 한계로 인한 자원 부족 발생. 사용량 제한 및 모델 교체 등 임시방편적 Rationing으로 인한 워크로드 안정성 저하 문제 직면.

Technical Solution

  • 연간 지출 약정(Annual Spending Commitment) 기반의 자원 할당 체계 구축
  • 1~3년 단위의 계약 기간에 따른 차등 할인율 적용을 통한 수요 예측 최적화
  • Forecasted Demand와 Commercial Commitments를 동기화한 공유 용량(Shared Capacity) 확보 구조 설계
  • 전용 인프라 확보를 통한 AI Agent 등 고부하 장기 실행 워크로드의 가용성 보장
  • Cloud Provider와의 협업을 통한 연산 자원 공급망의 가시성 확보 시도

1. 예측 불가능한 트래픽 폭증에 대비한 Reserved Instance 또는 Capacity Reservation 도입 검토

2. 단순 가용성 보장을 넘어 위반 시 보상이 포함된 Deterministic SLA 체계 구축 여부 확인

3. 인프라 공급망의 제약 사항을 고려한 워크로드별 모델 티어링(Tiering) 전략 수립

원문 읽기