Dev.toGLM-5.2 도입으로 Multi-step Tool Use 성공률 22% 향상GLM-5.2 open agent benchmark: 22% Less Tool FailureAI/MLintermediate26 분 소요2026년 6월 25일