Hugging Face Blog연구팀이 아랍어 STEM 및 코드 생성 평가를 위해 3개 데이터셋(Native STEM 865개, Synthetic STEM 1,744개, 코드 벤치마크)으로 구성된 3LM 벤치마크 도입📚 3LM: A Benchmark for Arabic LLMs in STEM and CodeAI/MLintermediate14 분 소요2025년 8월 1일