피드로 돌아가기
The RegisterInfrastructure
원문 읽기
OCI MSA 기반 1.6Tbps 확장 및 Heterogeneous Integration을 통한 AI 인프라 혁신
What the OCI MSA didn't solve for AI scaling
AI 요약
Context
AI GPU 클러스터의 대역폭 요구량 급증에 따라 기존의 Discrete Optical Assembly 기반 인터커넥트는 조립 복잡도와 낮은 수율로 인한 확장성 한계에 직면함. 특히 전력 효율성과 지연 시간 최적화를 위해 심볼 속도 증가 대신 파장 수 확장을 통한 Slow-and-Wide 전략 채택이 필수적인 상황임.
Technical Solution
- NRZ 변조 방식 채택을 통한 PAM-4 대비 광전력 소모 3배 절감 및 FEC 부하 최소화
- 50 GBaud SerDes 적용으로 100 GBaud 대비 비트당 전력 소모량을 약 1/3 수준으로 유지
- Wavelength-Division Multiplexing(WDM)을 통한 단일 파이버 내 데이터 경로 다중화로 대역폭 확장
- III-V 화합물 반도체와 Silicon Photonics의 Heterogeneous Integration으로 레이저 및 증폭기의 웨이퍼 레벨 통합 구현
- Discrete 부품 조립 공정을 Process-node 기반의 반도체 제조 공정으로 전환하여 신뢰성 및 생산성 확보
실천 포인트
- 대규모 트래픽 확장 시 Symbol-rate 증가보다 Parallelism(파장 확장) 기반의 Scaling 전략 검토 - 하드웨어 인터페이스 설계 시 Energy-per-bit 관점의 Trade-off 분석 수행 - 모듈형 조립 구조에서 통합 칩셋/웨이퍼 구조로의 전환 가능성 및 공급망 리스크 평가