Hugging Face BlogAI 연구팀이 과거 지식 평가 중심의 벤치마크에서 미래 이벤트 예측 능력 평가로 전환하며 데이터 오염 문제를 원천 차단Back to The Future: Evaluating AI Agents on Predicting Future EventsAI/MLintermediate26 분 소요2025년 7월 17일