피드로 돌아가기
Hacker NewsInfrastructure
원문 읽기
자체 설계 Olympus 코어 기반 Vera CPU로 AI 워크로드 성능 2배 달성
Nvidia Vera CPU Benchmarks: Olympus Cores Delivering Great Performance
AI 요약
Context
기존 Grace CPU의 Arm Neoverse-V2 코어 기반 설계에서 벗어나 Agentic AI 전용 고성능 연산 필요성 증대. x86_64 아키텍처와 경쟁 가능한 수준의 데이터 센터 CPU 성능 확보를 위한 아키텍처 전환 추진.
Technical Solution
- 자체 설계한 Olympus 코어를 도입하여 Armv9.2 ISA 호환 및 연산 효율 최적화
- Spatial Multi-threading 기술을 통한 총 176 Threads 처리 구조 설계
- Core당 L2 Cache를 2MB로 2배 증설하고 164MB의 Unified L3 Cache를 배치하여 메모리 병목 제거
- LPDDR5X 메모리 채택을 통한 최대 1.2TB/s의 고대역폭 메모리 인터페이스 구축
- PCIe Gen 6 및 CXL 3.1 연결 표준 적용으로 데이터 센터 내 장치 간 전송 속도 극대화
- GCC 16.1+ 및 LLVM Clang 21+ 컴파일러 조기 지원을 통한 바이너리 최적화 수행
실천 포인트
- AI 워크로드 설계 시 메모리 대역폭과 Cache 계층 구조가 성능 병목의 핵심임을 인지하고 검토 - 하드웨어 가속기 도입 시 컴파일러 최적화 지원 시점을 확인하여 소프트웨어 스택 준비 기간 산정 - 대규모 데이터 센터 설계 시 CXL
3.1과 같은 최신 상호연결 표준의 도입 가능성 검토