피드로 돌아가기
The RegisterInfrastructure
원문 읽기
HPC-as-a-service 기반 성능 3배 향상 및 Digital Twin 인프라 구축
Airbus gets HPC-as-a-service supercomputer from Bull
AI 요약
Context
24년간 지속된 HPE 레거시 시스템의 성능 한계로 인한 신규 기종 개발 병목 발생. CFD 시뮬레이션 및 Digital Twin 구현을 위해 고성능 연산 자원과 대규모 데이터 처리 능력이 필수적인 상황.
Technical Solution
- BullSequana XH3000 기반의 Modular Design을 채택하여 컨테이너 단위 사전 조립 및 신속 배포 구조 설계
- AMD Genoa 및 Turin Epyc 프로세서와 Nvidia GPU Blade를 혼합 구성한 Heterogeneous Computing 아키텍처 구현
- Nvidia InfiniBand NDR 도입을 통한 포트당 400 Gbps의 고속 인터커넥트 확보 및 데이터 전송 지연 최소화
- IBM Spectrum Scale Storage Scale System 적용으로 대규모 시뮬레이션 데이터의 고속 I/O 처리 최적화
- Multi-site 물리적 분산 환경에서 Batch Scheduler를 통한 자원 할당 및 단일 Supercomputer 논리적 통합 운영
- HPC-as-a-service 모델 도입을 통한 5년 단위 인프라 생애주기 관리 및 비용 최적화
Impact
- 기존 시스템 대비 연산 성능 3배 증가
- 400 Gbps 포트 대역폭을 통한 데이터 전송 속도 향상
- 계약 체결 후 14개월 만에 전체 인프라 구축 및 운영 완료
Key Takeaway
특수 목적의 고성능 연산 환경에서 하드웨어 소유권보다 서비스 중심의 HPC-as-a-service 모델을 통한 유연한 자원 확보와 기술 부채 해소 전략의 유효성 확인.
실천 포인트
1. 대규모 클러스터 구축 시 Modular Design을 통한 배포 시간 단축 검토
2. 워크로드 특성에 맞는 CPU/GPU 혼합 구성 및 Interconnect 대역폭 정밀 설계
3. 물리적 분산 사이트 운영 시 Batch Scheduler를 활용한 자원 효율화 방안 마련
4. 인프라 유지보수 비용 절감을 위한 서비스형 모델(As-a-Service) 도입 타당성 분석