Hugging Face BlogMicrosoft Research의 BitNet 아키텍처를 파인튜닝으로 적용해 기존 Llama3 8B 모델을 1.58비트 극단 양자화 모델로 변환하고 MMLU 벤치마크에서 Llama 1 7B를 초과하는 성능 달성Fine-tuning LLMs to 1.58bit: extreme quantization made easyAI/MLadvanced85 분 소요2024년 9월 18일