PRX 팀이 Flow Matching 기반 텍스트-이미지 모델의 학습 파이프라인을 체계적으로 검증해 REPA 정렬, 토큰 라우팅, BF16 정밀도 관리 등으로 수렴 속도 및 이미지 품질 개선
Training Design for Text-to-Image Models: Lessons from Ablations
Training Design for Text-to-Image Models: Lessons from Ablations
π0 and π0-FAST: Vision-Language-Action Models for General Robot Control