피드로 돌아가기
The RegisterInfrastructure
원문 읽기
CXL 3.0 기반 Memory Pooling으로 512GB/s 대역폭 확보 및 메모리 자원 공유
Memory godboxes could offer relief from the RAMpocalypse
AI 요약
Context
전통적인 서버 구조는 Local DDR5에 의존하여 DRAM 부족 시 확장성이 제한적인 구조적 한계 보유. 특히 AI 추론 시 발생하는 대규모 KV Cache 처리 과정에서 메모리 비용 상승과 Flash Storage의 수명 저하 문제 직면.
Technical Solution
- CXL.mem/cache/io 인터페이스를 통한 CPU, 메모리, 가속기 간 Cache-coherent 연결 구조 설계
- CXL 2.0의 Memory Pooling 기능을 통한 하드웨어 자원의 동적 할당 및 파티셔닝 구현
- CXL 3.0 Fabric 도입으로 다수 CXL Switch를 연결하여 대규모 토폴로지 확장성 확보
- Memory Sharing 메커니즘을 통한 동일 워크로드 간 데이터 중복 제거 및 메모리 효율 극대화
- PCIe 6.0 기반의 물리 계층 채택으로 고대역폭 데이터 전송 통로 구축
- CXL 3.1 이상의 Confidential Computing 적용을 통한 공유 메모리 환경의 데이터 격리 및 보안 강화
실천 포인트
- 고용량 KV Cache 오프로딩 필요 시 Flash Storage 대신 CXL 기반 메모리 계층 검토 - NUMA Latency(약 200ns)를 허용하는 워크로드인지 분석 후 Memory Godbox 도입 결정 - 차세대 CPU(Xeon 6, Epyc Turin 등) 도입 시 CXL
3.0 Fabric 지원 여부 확인