Meta가 Llama 3.2를 출시해 멀티모달 비전 기능과 1B/3B 소형 온디바이스 모델 추가

Llama can now see and run on your device - welcome Llama 3.2

2024년 9월 25일9분intermediate

AI 요약

Context

기존 Llama 모델은 텍스트 전용이었으며, 엣지 디바이스에서 실행할 수 있는 초소형 모델이 부족했다. 대규모 멀티모달 작업을 처리하려면 고사양 인프라가 필요했다.

비전 타워를 추가하면서 기존 텍스트 모델을 동결해 멀티모달 능력을 확보하면서도 텍스트 성능을 보존할 수 있다. 초소형 온디바이스 모델의 추가 제공으로 엣지 배포와 클라우드 대규모 처리를 동시에 지원하는 모델 라인업 다양화 전략의 효과.

실천 포인트

비전 기반 업무(문서 QA, 이미지 분석)를 처리해야 하는 팀에서 Llama

3.2 11B/90B를 도입하면 멀티모달 추론 파이프라인을 구축할 수 있고, 온디바이스 배포가 필요한 경우 1B/3B 모델로 로컬 실행 환경을 제공해 클라우드 비용과 지연시간을 절감할 수 있다.

태그