피드로 돌아가기
SemiAnalysis访谈Radiant的AIInfra主管PatrickWohlschlegel
Dev.toDev.to
Infrastructure

SemiAnalysis访谈Radiant的AIInfra主管PatrickWohlschlegel

Behind-the-meter 전력 확보를 통한 12개월 내 Gigawatt급 AI DC 구축

cognitalk2026년 6월 12일1advanced

Context

전통적인 AI 데이터센터 구축 시 토지 확보, 전력망 연결, 거대 자본 조달이라는 세 가지 핵심 병목 지점으로 인한 긴 배포 주기 발생. 특히 GPU 밀도 증가에 따른 고전력 요구사항이 기존 Grid Connected 인프라의 한계를 초과하는 상황.

Technical Solution

  • Brookfield AI 펀드와의 통합을 통한 Greenfield 사이트 및 발전소 직접 확보로 전력 공급 경로 최적화
  • 전력망 연결 대기 시간을 제거하는 Behind-the-meter Power Generation 전략 채택을 통한 인프라 구축 속도 극대화
  • 2027년 도입 예정인 랙당 400kW 초고밀도 GPU 환경 대응을 위한 CDU(Cooling Distribution Unit) 기반 냉각 설계 사전 반영
  • Bare Metal, VM, Kubernetes 환경을 유연하게 전환하는 Radiant Cloud OS 구축으로 인프라 추상화 계층 구현
  • Slurm 기반의 대규모 Distributed Training 환경과 Inference 서비스를 즉각적으로 전환 가능한 Elastic Resource Scheduling 로직 적용
  • 전력-시설-하드웨어-소프트웨어 전 계층의 Vertical Integration을 통한 Full-stack Observability 파이프라인 구축

- GPU 랙 밀도 증가에 따른 전력 및 냉각 용량의 상한선을 사전에 정의했는가 - 워크로드 특성(Training vs Inference)에 따라 인프라 구성을 동적으로 변경할 수 있는 추상화 레이어가 존재하는가 - 물리적 인프라의 장애가 소프트웨어 계층의 SLA에 미치는 영향을 추적할 수 있는 통합 Observability 체계를 갖췄는가

원문 읽기