피드로 돌아가기
Hugging Face BlogAI/ML
원문 읽기
Transformers.js가 WebGPU 런타임을 C++로 재구현하고 빌드 시간을 2초에서 200ms로 단축하며 번들 크기를 53% 감소
Transformers.js v4 Preview: Now Available on NPM!
AI 요약
Context
Transformers.js v3는 모든 모델 정의가 8,000줄 이상인 단일 models.js 파일에 집중되어 새로운 모델 추가가 어려웠고, 단일 패키지 구조로 인해 사용 사례별 세분화가 불가능했습니다. 또한 기존 내보내기 전략이 성능 최적화를 제한했고, Webpack 기반 빌드는 2초 이상 소요되어 개발 반복이 느렸습니다.
실천 포인트
JavaScript 기반 ML 라이브러리 또는 대규모 모노패키지 프로젝트를 관리하는 팀은 pnpm workspaces로 도메인별 모듈을 분리하고, 성능 크리티컬 경로에 하드웨어 가속 런타임(WebGPU, ONNX Runtime Contrib Operators)을 통합하면 빌드 시간을 50% 이상 단축하고 추론 성능을 3배 이상 향상시킬 수 있습니다.