피드로 돌아가기
Dev.toInfrastructure
원문 읽기
AI 가속기 BOM 비용 66%를 차지하는 Memory 중심의 구조적 병목 현상
Memory is two-thirds of what an AI chip costs to build
AI 요약
Context
과거 HPC GPU는 Logic Die 중심의 비용 구조를 가졌으나, 대규모 모델 학습 및 서빙 요구사항으로 인해 Memory 비용 비중이 급증함. 현재 AI 가속기 설계의 실질적 제약 사항이 Logic 공정 수율에서 HBM 공급량으로 전이된 상황임.
Technical Solution
- BOM(Bill of Materials) 내 Memory 비용 비중을 약 2/3 수준으로 상향 설계하여 데이터 처리 대역폭 확보
- Logic Die의 미세 공정 개선보다 HBM Stack 공급 최적화에 우선순위를 둔 하드웨어 수급 전략 채택
- HBM3E에서 HBM4로의 세대 전환을 통한 Stack당 밀도 및 속도 향상으로 패키지 풋프린트 효율화 도모
- 메모리 벤더(SK Hynix, Samsung, Micron)의 생산 캘린더를 기반으로 한 트레이닝 클러스터 출하 일정 동기화
- Compute 효율성 개선보다 Memory Pricing 곡선에 종속된 전체 칩 경제성 구조 설계
실천 포인트
- 인프라 확장 시 GPU 수량뿐 아니라 HBM 공급망의 병목 지점 확인 - 차세대 AI 가속기 도입 시 HBM4의 램프업(Ramp-up) 일정과 벤더별 용량 확장 계획 검토 - Compute Scarcity 문제를 Logic 성능이 아닌 Memory Bandwidth 및 용량 관점에서 분석