Hugging Face BlogAmazon SageMaker와 Hugging Face Transformers를 통해 GPT-J 6B의 모델 로드 시간을 210초에서 7.7초로 단축해 프로덕션 배포 가능 수준으로 개선Deploy GPT-J 6B for inference using Hugging Face Transformers and Amazon SageMakerBackendintermediate22 분 소요2022년 1월 11일