4천만 개 저장소 대상 다국어 메타데이터셋 구축 및 3종 분류기 앙상블 제공
Accelerating researchers and developers building multilingual AI with a new open dataset
Accelerating researchers and developers building multilingual AI with a new open dataset
메타가 1,600개 언어 기계번역 모델(OMT-LLaMA)을 개발했으나, 저자원 언어 데이터 수집 및 언어 식별 정확도 문제가 여전한 상황
HuggingFace, IISc partner to supercharge model building on India's diverse languages
Welcome fastText to the Hugging Face Hub