Photoroom이 픽셀 공간 학습, 지각 손실, 토큰 라우팅, 표현 정렬 등 4가지 기법을 결합하여 32개 H200 GPU로 24시간 내에 텍스트-이미지 확산 모델 학습
PRX Part 3 — Training a Text-to-Image Model in 24h!
PRX Part 3 — Training a Text-to-Image Model in 24h!
Training Design for Text-to-Image Models: Lessons from Ablations