Cohere가 데이터 중재(Data Arbitrage), 다국어 선호도 학습, 안전 튜닝, 모델 병합을 결합해 Aya Expanse 8B/32B 모델을 개발해 다국어 성능에서 새로운 최고 수준 달성
A Deepdive into Aya Expanse: Advancing the Frontier of Multilinguality
A Deepdive into Aya Expanse: Advancing the Frontier of Multilinguality
🤗 PEFT welcomes new merging methods
SegMoE: Segmind Mixture of Diffusion Experts