Hugging Face BlogHugging Face가 Qwen3-4B 모델에 간소화된 스캐폴딩과 Kaggle 노트북 기반 학습 데이터를 적용해 DABStep 벤치마크 어려운 과제 정확도를 2.1%에서 3.4%로 향상Jupyter Agents: training LLMs to reason with notebooksAI/MLintermediate38 분 소요2025년 9월 10일