Hugging Face BlogHugging Face가 kernel-builder 라이브러리를 통해 커스텀 CUDA 커널 개발 및 배포 프로세스를 표준화하고 PyTorch 네이티브 연산으로 등록 가능하게 구현From Zero to GPU: A Guide to Building and Scaling Production-Ready CUDA KernelsBackendintermediate41 분 소요2025년 8월 18일