Hacker NewsLLM의 수학적 추론 능력 검증을 위한 100개 고난도 벤치마크 데이터셋 구축Benchmarks in LeipzigAI/MLintermediate5 분 소요3일 전
Hugging Face BlogNumina와 Hugging Face가 DeepSeekMath-Base 7B를 Fine-tuning하고 Self-Consistency + Tool Integrated Reasoning 알고리즘을 적용해 AIMO 1차 진출 상 우승 및 50개 문제 중 29개 해결How NuminaMath Won the 1st AIMO Progress PrizeAI/MLadvanced41 분 소요2024년 7월 11일