Hugging Face BlogSalesforce Research가 Q-Former를 도입해 동결된 비전 인코더와 LLM을 연결함으로써 멀티모달 사전학습 비용을 대폭 감소시킨 BLIP-2 모델 개발Zero-shot image-to-text generation with BLIP-2AI/MLintermediate21 분 소요2023년 2월 15일