Hacker NewsMoE 아키텍처 기반 30T 토큰 학습 및 Off-policy RL 안정화로 Agentic Coding 성능 극대화Laguna XS.2 and M.1AI/MLadvanced37 분 소요2026년 4월 28일
Hacker NewsLong-Horizon Task 정복을 위한 GLM-5.1의 추론 최적화 전략GLM-5.1: Towards Long-Horizon TasksAI/MLadvanced2026년 4월 7일