피드로 돌아가기
Hugging Face BlogAI/ML
원문 읽기
Hugging Face와 IBM이 watsonx.ai 통합으로 Transformer 기반 모델 배포 파이프라인 표준화
Hugging Face and IBM partner on watsonx.ai, the next-generation enterprise studio for AI builders
AI 요약
Context
엔터프라이즈 조직은 수백~수천 개의 서로 다른 AI 모델을 동시에 운영하며, 각 사용 사례별 최적 모델 구축과 신규 모델의 빠른 프로덕션 배포 필요성을 겪고 있다. 기존에는 클라우드 규정 준수 제약이 있는 고객들이 온프레미스 ML 플랫폼을 자체 구축해야 했다.
Technical Solution
- transformers, accelerate, peft, Text Generation Inference 서버 등 Hugging Face 오픈소스 라이브러리를 watsonx.ai에 통합
- RedHat OpenShift 기반으로 클라우드 및 온프레미스 배포 모두 지원
- Hugging Face Hub의 모델과 데이터셋을 watsonx.ai에서 네이티브로 사용 가능하도록 연결
- IBM의 대규모 언어 모델 컬렉션을 오픈소스화하여 Hugging Face Hub에 공개 예정
- 표준화된 DevOps 도구로 watsonx.ai 배포 및 관리 지원
Key Takeaway
Transformer 아키텍처 표준화와 오픈소스 라이브러리 생태계 통합을 통해 엔터프라이즈 환경에서 다중 모델 배포 파이프라인의 복잡성을 감소시킬 수 있다.
실천 포인트
대규모 조직에서 규정 준수(컴플라이언스)로 인해 클라우드 사용이 제한된 환경에서도 Hugging Face의 사전학습 모델과 오픈소스 라이브러리를 RedHat OpenShift 기반의 온프레미스 플랫폼에 통합 배포하면 자체 ML 플랫폼 구축 비용 및 시간을 절감할 수 있다.