피드로 돌아가기
Hacker NewsHacker News
Infrastructure

자체 설계 Olympus 코어 기반 Vera CPU로 AI 워크로드 성능 2배 달성

Nvidia Vera CPU Benchmarks: Olympus Cores Delivering Great Performance

2026년 5월 27일5advanced

Context

기존 Grace CPU의 Arm Neoverse-V2 코어 기반 설계에서 벗어나 Agentic AI 전용 고성능 연산 필요성 증대. x86_64 아키텍처와 경쟁 가능한 수준의 데이터 센터 CPU 성능 확보를 위한 아키텍처 전환 추진.

Technical Solution

  • 자체 설계한 Olympus 코어를 도입하여 Armv9.2 ISA 호환 및 연산 효율 최적화
  • Spatial Multi-threading 기술을 통한 총 176 Threads 처리 구조 설계
  • Core당 L2 Cache를 2MB로 2배 증설하고 164MB의 Unified L3 Cache를 배치하여 메모리 병목 제거
  • LPDDR5X 메모리 채택을 통한 최대 1.2TB/s의 고대역폭 메모리 인터페이스 구축
  • PCIe Gen 6 및 CXL 3.1 연결 표준 적용으로 데이터 센터 내 장치 간 전송 속도 극대화
  • GCC 16.1+ 및 LLVM Clang 21+ 컴파일러 조기 지원을 통한 바이너리 최적화 수행

- AI 워크로드 설계 시 메모리 대역폭과 Cache 계층 구조가 성능 병목의 핵심임을 인지하고 검토 - 하드웨어 가속기 도입 시 컴파일러 최적화 지원 시점을 확인하여 소프트웨어 스택 준비 기간 산정 - 대규모 데이터 센터 설계 시 CXL

3.1과 같은 최신 상호연결 표준의 도입 가능성 검토

원문 읽기