전체 피드 소스 목록

카테고리

Frontend Backend DevOps AI/ML Mobile Database Security Career Infrastructure

© 2026 DevPick

#multimodal-learning

피드 검색 북마크 설정

Hugging Face Blog

Hugging Face가 Vision Language Model의 아키텍처, 평가 방법론, 파인튜닝 프레임워크를 종합적으로 설명하여 멀티모달 모델 도입 가이드 제공

Vision Language Models Explained

AI/MLintermediate24 분 소요2024년 4월 11일

Hugging Face Blog

Kakao Brain이 공개 데이터셋 COYO-700M으로 학습한 ViT와 ALIGN 모델을 오픈소스 공개하여 Google의 폐쇄 데이터셋 모델과 동등한 성능 달성

New ViT and ALIGN Models From Kakao Brain

AI/MLintermediate34 분 소요2023년 3월 6일

Hugging Face Blog

Hugging Face가 Vision-Language 모델의 5가지 사전학습 전략(Contrastive Learning, PrefixLM, Cross Attention, MLM/ITM, No Training)을 Transformers에 통합해 멀티모달 태스크 구현 단순화

A Dive into Vision-Language Models

AI/MLintermediate53 분 소요2023년 2월 3일