Hugging Face BlogLanguage Technologies Lab이 SigLIP 인코더와 MLP 프로젝터를 Salamandra 7B LLM에 통합해 이미지·비디오 멀티모달 이해 능력 추가Visual Salamandra: Pushing the Boundaries of Multimodal UnderstandingAI/MLintermediate12 분 소요2025년 4월 11일