Hugging Face BlogDPO 도입을 통한 OCR Text Degeneration 59.4% 평균 감소Direct Preference Optimization Beyond ChatbotsAI/MLadvanced36 분 소요2026년 6월 3일