Hugging Face BlogHugging Face Transformers 팀이 그래디언트 누적(Gradient Accumulation) 중 손실 계산 방식을 수정해 토큰 레벨 작업에서 수학적 동등성 보장Fixing Gradient AccumulationAI/MLintermediate10 분 소요2024년 10월 16일