피드로 돌아가기
The RegisterInfrastructure
원문 읽기
Alibaba delivers RISC-V server chip optimized to run China’s top AI models
Alibaba가 RISC-V 기반 XuanTie C950 서버 칩을 개발해 Qwen3, DeepSeek V3 같은 수백억 파라미터 대규모 언어모델을 네이티브 지원
AI 요약
Context
RISC-V 아키텍처는 고성능 AI 워크로드를 실행할 수 있는 서버급 프로세서가 부족했다. 중국 칩메이커들은 서방의 고성능 칩에 비해 뒤처져 있으며, 자체 AI 모델 추론을 위해 최적화된 하드웨어가 필요했다.
Technical Solution
- XuanTie Tensor Processing Engine(TPE) 자체 개발: FP16부터 INT4/FP8, MXFP8/MXFP4/RVFP4 마이크로 스케일 포맷 지원, TPE당 8 TOPS 처리 능력
- 64비트 멀티코어 CPU IP 구조 설계: 초저지연 4사이클 L1 데이터 캐시, 코어별 전용 L2 캐시, 이중단계 주소 변환 MMU 구현
- RISC-V RVA 23.1 버전 네이티브 지원: 2025년 8월 제안된 최신 명세를 직접 구현
- XL-300 인터커넥트로 8코어 클러스터 멀티프로세서 모드 지원
- 5nm 공정 기반 제조: 클라우드 서버, 생성형 AI 워크로드, 로봇공학, 엣지 컴퓨팅 디바이스 대상
Impact
- SPECint 2006 벤치마크 단일코어 성능 70점 이상 달성
- SPECInt 2017 벤치마크 결과 2.6GHz에서 Apple M1(2020년 출시)과 거의 동등 수준
Key Takeaway
자체 AI 모델과 칩 설계를 긴밀히 공동 설계하면 특정 워크로드에 최적화된 비용 효율적인 시스템을 구축할 수 있으며, 오픈 표준 ISA(RISC-V)를 채택해도 독점 기술(TPE)을 통해 차별화 가능하다.
실천 포인트
자체 AI 모델을 운영 중인 클라우드 인프라 팀은 모델 추론 특성(대규모 배치, 낮은 레이턴시 요구사항, 데이터 타입 범위)을 칩 설계팀과 공유해 가속기 명령어 세트와 캐시 계층을 함께 최적화하면, 범용 서버 대비 비용 효율성과 처리 성능을 동시에 개선할 수 있다.