Microsoft와 NVIDIA가 Microsoft Foundry를 NVIDIA 가속기와 통합하고 Vera Rubin NVL72 시스템을 Azure 데이터센터에 배포하여 프로덕션급 AI 에이전트와 Physical AI 시스템 운영 능력 제공

Microsoft at NVIDIA GTC: New solutions for Microsoft Foundry, Azure AI infrastructure and Physical AI

Yina Arenas2026년 3월 16일8분intermediate

AI 요약

Context

기존 AI 시스템은 프로토타입에서 프로덕션 규모의 에이전트 운영으로의 전환이 복잡하고, 추론 중심 워크로드에 최적화된 인프라가 부족했으며, Physical AI를 클라우드 규모로 운영할 통합 플랫폼이 없었다.

Technical Solution

Foundry Agent Service를 일반 공급 시작: 에이전트가 도구, 데이터, 워크플로우를 활용하여 추론·계획·실행할 수 있도록 설계
Foundry Control Plane에 관찰성 기능 추가: 개발자가 에이전트 동작에 대한 end-to-end 가시성 확보
NVIDIA Nemotron 모델을 Microsoft Foundry에 통합: 오픈 가중치 모델을 저레이턴시 자산으로 미세조정 가능
Voice Live API와 Foundry Agent Service 연동(공개 미리보기): 음성 기반 멀티모달 실시간 에이전트 경험 제공
Azure 데이터센터에 liquid-cooled Grace Blackwell GPU 수십만 대 배포 및 Vera Rubin NVL72 시스템 롤아웃
Foundry Local에서 NVIDIA Vera Rubin 플랫폼 지원 초기 제공: 고객 관리 환경에서 가속화된 AI 기능 확장
Microsoft Fabric과 NVIDIA Omniverse 라이브러리 통합: 물리적 자산, 시뮬레이션, 클라우드 학습 환경을 반복 가능한 엔터프라이즈급 파이프라인으로 연결
Azure Physical AI Toolchain GitHub 저장소 공개: Physical AI Data Factory와 Azure 서비스 통합

Impact

1년 이내에 수십만 대의 liquid-cooled Grace Blackwell GPU를 글로벌 데이터센터에 배포 완료

Key Takeaway

프로덕션급 AI 시스템 운영을 위해서는 모델·도구·데이터·관찰성을 통합한 단일 플랫폼(Foundry)과 이를 뒷받침하는 목적별 하드웨어 인프라(추론 중심 NVIDIA 시스템)의 깊은 통합이 필수이며, 소버린·규제 환경까지 지원하는 일관된 거버넌스 계층(Azure Arc, Foundry Local)이 엔터프라이즈 신뢰도를 결정한다.

실천 포인트

대규모 AI 에이전트를 프로덕션 환경에서 운영해야 하는 조직은 Foundry Control Plane의 관찰성 기능을 활용하여 에이전트 동작의 전 생명주기에 대한 가시성을 확보하고, inference 중심 워크로드에 최적화된 전용 GPU 인프라(NVIDIA Vera Rubin 같은 차세대 시스템)와의 통합을 사전에 계획하면, 프로토타입에서 프로덕션으로의 전환 시간을 단축하고 운영 안정성을 확보할 수 있다.

태그

#NVIDIA #AI Infrastructure #Agent Computing #Microsoft Foundry #Physical AI

원문 읽기