Hugging Face BlogHugging Face TRL 라이브러리가 DDPO(Denoising Diffusion Policy Optimization)를 구현해 Stable Diffusion 모델의 이미지 생성 품질을 인간의 미적 선호도에 맞춰 파인튜닝 가능하게 함Finetune Stable Diffusion Models with DDPO via TRLAI/MLintermediate24 분 소요2023년 9월 29일