전체 피드 소스 목록

카테고리

Frontend Backend DevOps AI/ML Mobile Database Security Career Infrastructure

© 2026 DevPick

#mathematical-reasoning

피드 검색 북마크 설정

Hacker News

LLM의 수학적 추론 능력 검증을 위한 100개 고난도 벤치마크 데이터셋 구축

Benchmarks in Leipzig

AI/MLintermediate5 분 소요3일 전

Hugging Face Blog

Numina와 Hugging Face가 DeepSeekMath-Base 7B를 Fine-tuning하고 Self-Consistency + Tool Integrated Reasoning 알고리즘을 적용해 AIMO 1차 진출 상 우승 및 50개 문제 중 29개 해결

How NuminaMath Won the 1st AIMO Progress Prize

AI/MLadvanced41 분 소요2024년 7월 11일