GeekNewsVibeThinker-3B: SFT+GRPO로 Opus 4.5 추론 성능을 넘긴 3B 모델3B 파라미터로 Opus 4.5급 추론 성능을 구현한 VibeThinker-3BAI/MLadvanced17 분 소요2026년 6월 25일