피드로 돌아가기
중국 딥시크, V4-Pro API 75% 영구 가격 인하 단행
GeekNewsGeekNews
AI/ML

중국 딥시크, V4-Pro API 75% 영구 가격 인하 단행

V4-Pro API 비용 75% 인하를 통한 AI 추론 시장 파괴

recast78382026년 5월 26일2intermediate

Context

미국 수출 규제로 인한 NVIDIA 하드웨어 수급 제한 및 높은 인프라 비용으로 인한 V4-Pro 모델의 높은 운영 단가 유지. Flash 모델 대비 최대 12배 높은 접근 비용으로 인한 서비스 확장성 제약 발생.

Technical Solution

  • 화웨이 Ascend 950 AI 칩 도입을 통한 컴퓨팅 인프라의 국산화 및 하드웨어 의존성 다변화
  • 추론 비용 절감을 위한 인프라 최적화 및 하드웨어 가속기 효율 개선
  • 하드웨어 제약 완화에 따른 모델 서빙 아키텍처의 비용 구조 재설계
  • 대규모 추론 트래픽 처리를 위한 인프라 가용성 확보 및 토큰당 비용 최적화

Impact

  • V4-Pro API 이용 가격 75% 영구 인하
  • 토큰 100만 개당 비용 0.1~24위안에서 0.025~6위안으로 대폭 감소

Key Takeaway

특정 벤더의 하드웨어 종속성을 탈피한 인프라 다변화가 AI 모델의 추론 비용 및 시장 경쟁력 결정의 핵심 요소임.


- 특정 HW 벤더 종속성(Vendor Lock-in) 제거를 위한 추론 가속기 다변화 검토 - 하드웨어 제약 사항이 소프트웨어 Pricing 전략에 미치는 영향 분석 - 인프라 비용 감소 시점을 활용한 AI Agent 및 서비스 확장 전략 수립

원문 읽기