피드로 돌아가기
Hugging Face BlogInfrastructure
원문 읽기
미국의 AI 칩 수출 규제가 중국의 자체 칩 개발(Huawei Ascend, Cambricon)과 오픈소스 AI 모델 혁신을 촉발하며 글로벌 AI 인프라의 중심이 재편됨
On the Shifting Global Compute Landscape
AI 요약
Context
AI 칩 생산이 사실상 미국 중심이었으나, 2022년 바이든 정부의 NVIDIA GPU 수출 규제로 중국이 고급 칩 접근성 제약을 겪게 되었다. 이 규제는 중국 기업들의 칩 자급 전략과 알고리즘 효율화 연구를 가속화시킨 의도하지 않은 촉매가 되었다.
Technical Solution
- 자체 칩 개발 가속화: Huawei Ascend(2018년 초기 출시, 2024년부터 확대 배포), Cambricon, Baidu Kunlun 등 중국 자체 개발 칩이 학습과 추론 모두에 활용되기 시작
- Full-stack 국내 생태계 구축: Alibaba 등 중국 기업들이 NVIDIA 의존도 감소, 칩 제조사와 연구팀의 협업으로 비NVIDIA 에코시스템 구축
- 오픈소스 AI 모델 최적화: DeepSeek의 Multi-head Latent Attention(MLA)과 Group Relative Policy Optimization(GRPO) 같은 컴퓨팅 효율 기술 도입, 중국 칩에 최적화된 Qwen, GLM, Kimi 등 모델 개발
- 소프트웨어 스택 전환: CUDA 대체 기술 출현으로 칩 제조사별 최적화된 소프트웨어 에코시스템 형성
- 규제 환경 변화: 2025년 1월 AI Diffusion Rule 시행 → H20 칩에 대한 15% 수익 공유 협상 → 5월 규칙 철회 → 8월 Alibaba 추론용 신규 칩 발표
Impact
BIS 수출 제어 프레임워크 개편 시 A800/H800 칩 제어를 위해 총처리 성능(TPP)과 성능 밀도 신 지표 도입. 2025년 1월 DeepSeek 공개 이후 Ascend, Cambricon, Kunlun 채택이 급증. 미국 스타트업의 상당 부분이 중국 오픈소스 모델로 개발 중이며, LMArena에서 중국 오픈소스 모델이 인기도에서 선두 위치 점유.
Key Takeaway
기술 규제는 의도와 달리 대상 국가의 자체 기술 개발을 촉발할 수 있으며, 오픈소스 생태계의 개방성과 협업은 칩 스케일의 하드웨어 플랫폼 경쟁에서도 혁신을 가속화한다. 글로벌 AI 인프라는 단일 벤더 의존도가 낮아질수록 더 탄력적이고 다양한 기술 경로가 발전한다.
실천 포인트
AI 모델 개발팀에서 단일 가속기(CUDA/NVIDIA)에 최적화된 구조를 유지할 경우, 향후 공급망 변동이나 규제로 인한 리스크에 노출된다. 컴퓨팅 효율 기술(MLA, GRPO 같은 주의메커니즘 개선)과 다중 백엔드 지원(ROCm, 기타 오픈 표준)을 조기에 도입하면 칩 다양성 환경에서 적응 능력을 확보할 수 있다.