Hugging Face BlogHugging Face가 Assisted Generation 디코딩 방식을 도입해 대규모 언어 모델의 텍스트 생성 레이턴시를 최대 10배 단축Assisted Generation: a new direction toward low-latency text generationAI/MLintermediate35 분 소요2023년 5월 11일