Hacker NewsMoE 아키텍처 기반 30T 토큰 학습 및 Off-policy RL 안정화로 Agentic Coding 성능 극대화Laguna XS.2 and M.1AI/MLadvanced37 분 소요2026년 4월 28일