피드로 돌아가기
Anthropic, SpaceX와의 컴퓨트 계약으로 Claude 사용 한도를 2배로 확대
GeekNewsGeekNews
Infrastructure

Anthropic, SpaceX와의 컴퓨트 계약으로 Claude 사용 한도를 2배로 확대

22만 개 GPU 확보를 통한 Claude 추론 및 API 한도 2배 확대

xguru2026년 5월 7일12advanced

Context

LLM 모델의 고도화에 따른 추론 비용 및 연산 수요 급증으로 기존 컴퓨트 인프라의 한계 직면. 특히 피크 시간대 Rate Limit 및 짧은 시간 창(5시간) 제한으로 인한 사용자 경험 저하와 API 처리량 병목 발생.

Technical Solution

  • SpaceX Colossus 1 데이터센터 전용 계약을 통한 300MW급 전력 인프라 및 NVIDIA GPU 22만 개 이상의 연산 자원 확보
  • AWS Trainium, Google TPU, NVIDIA GPU 등 Heterogeneous Hardware 전략을 통한 학습 및 추론 워크로드 최적화
  • Amazon, Google, Microsoft 등 다중 CSP(Cloud Service Provider) 파트너십 기반의 Multi-Region 인프라 확장으로 Data Residency 및 Compliance 대응
  • 전력망 부하 및 지역 규제 대응을 위한 분산 데이터센터 배치 및 에너지 비용 분담 구조 설계
  • 궤도 AI 컴퓨팅 용량 개발 검토를 통한 지상 인프라 제약 극복 및 연산 가용성 확장 시도

1. 특정 CSP 종속성을 탈피하기 위해 Multi-Cloud 및 Heterogeneous Hardware 전략 검토

2. 트래픽 피크 시간대 Throttling 정책을 단순 제한이 아닌 가용 자원 기반의 동적 할당 구조로 개선

3. 글로벌 서비스 확장 시 국가별 Data Residency 및 Compliance 요구사항을 인프라 설계 단계부터 반영

원문 읽기