Dev.to확률적 AI 코드를 수학적 결정론으로 검증하는 Axiom 엔진Axiom: Deterministic Integrity Engine for Probabilistic AIAI/MLadvanced13 분 소요1일 전
Hugging Face BlogNumina & Kimi 팀이 Test-Time RL Search와 Lemma-Enabled Pattern을 도입해 형식 증명 모델의 miniF2F 벤치마크 통과율을 92.2%로 달성Kimina-Prover: Applying Test-time RL Search on Large Formal Reasoning ModelsAI/MLadvanced80 분 소요2025년 7월 10일