3B 파라미터 모델로 AIME26 97.1점 달성 및 추론 성능 극대화
VibeThinker: 3B param model that beats Opus 4.5 on reasoning with novel SFT+GRPO
VibeThinker: 3B param model that beats Opus 4.5 on reasoning with novel SFT+GRPO
Self-Distillation Enables Continual Learning [pdf]
자기 증류(Self-Distillation)로 구현한 코드 생성 정밀도 향상 전략
SigLIP 2: A better multilingual vision language encoder