Hugging Face BlogHugging Face가 AutoGPTQ를 Transformers에 통합해 LLM을 2~8비트 정밀도로 양자화하고 약 4배의 메모리 절감 달성Making LLMs lighter with AutoGPTQ and transformersAI/MLintermediate26 분 소요2023년 8월 23일