피드로 돌아가기
GeekNewsAI/ML
원문 읽기
GLM-5.2, Artificial Analysis 오픈 가중치 모델 1위 등극
GLM-5.2: 744B 파라미터 기반 오픈 가중치 모델 지능 지수 1위 달성
AI 요약
Context
기존 오픈 가중치 모델들의 추론 능력 한계와 고비용 구조 해결 필요성 증대. 특히 과학적 추론과 복잡한 코딩 태스크에서의 성능 격차를 줄이기 위한 고밀도 모델 아키텍처 설계 요구됨.
Technical Solution
- Mixture-of-Experts(MoE) 구조를 통한 744B 전체 파라미터 중 40B 활성 파라미터만 사용하는 효율적 추론 설계
- Context Window를 200K에서 1M 토큰으로 확장하여 대규모 데이터 처리 및 장기 기억 유지 능력 강화
- Reasoning 토큰 비중을 높인 사고 체인(Chain-of-Thought) 최적화로 과학적 추론 및 코딩 정확도 개선
- Intelligence vs Cost Pareto frontier 달성을 통한 지능 수준 대비 태스크당 비용 최적화
- MIT 라이선스 채택 및 다양한 Third-party API 제공을 통한 접근성 및 배포 유연성 확보
Impact
- Intelligence Index v4.1 점수 51점으로 오픈 가중치 모델 중 1위 기록 (전작 대비 11점 상승)
- GDPval-AA v2 지표 1524점으로 GPT-5.5(xhigh reasoning) 수준의 에이전트 성능 도달
- 과학적 추론 지표 CritPt +16점(21%), HLE +12점(40%), SciCode +7점(50%) 상승
- Hallucination rate를 29.4%에서 28.1%로 낮추어 응답 신뢰성 개선
Key Takeaway
모델의 절대적 크기보다 활성 파라미터의 효율적 운용과 Reasoning 토큰 최적화가 실질적 지능 향상의 핵심임. 특히 추론 비용과 성능 사이의 Trade-off를 정밀하게 조정하여 Pareto frontier를 확보하는 전략이 중요함.
실천 포인트
- 고성능 추론이 필요한 경우 'Max' 설정 대신 'High' 설정을 검토하여 토큰 사용량을 2~
2.5배 절감 - 1M Context Window를 활용한 대규모 코드베이스 분석 및 에이전트 워크플로우 설계 - VRAM 요구량이 높은 700B급 모델 도입 시, GPU 자체 호스팅의 TCO와 상용 API 비용의 Trade-off 분석