전체 피드 소스 목록

카테고리

Frontend Backend DevOps AI/ML Mobile Database Security Career Infrastructure

© 2026 DevPick

#model-compilation

피드 검색 북마크 설정

Hugging Face Blog

Hugging Face Transformers와 AWS Inferentia를 결합하여 BERT 추론 레이턴시를 5-6ms로 단축하고 GPU 대비 80% 비용 절감

Accelerate BERT inference with Hugging Face Transformers and AWS Inferentia

AI/MLintermediate22 분 소요2022년 3월 16일

Hugging Face Blog

Hugging Face가 라이브러리 최적화, 컴파일 기반 그래프 최적화, 하드웨어별 튜닝을 단계적으로 적용해 Transformer 추론 속도 100배 향상

How we sped up transformer inference 100x for 🤗 API customers

AI/MLadvanced10 분 소요2021년 1월 18일