Dev.toGRPO 기반 RL 및 OPD 증류를 통한 Qwen-Image-2.0 성능 최적화The Interesting Part of Qwen-Image-2.0-RL Is Not the Image ScoreAI/MLadvanced16 분 소요3일 전
Hacker NewsKV cache 90% 절감 및 1M 토큰 컨텍스트 구현한 MoE 아키텍처DeepSeek-V4: Towards Highly Efficient Million-Token Context IntelligenceAI/MLadvanced16 분 소요2026년 4월 24일