피드로 돌아가기
Welcome PaddlePaddle to the Hugging Face Hub
Hugging Face BlogHugging Face Blog
AI/ML

Hugging Face와 PaddlePaddle이 협력해 75개 이상의 PaddlePaddle 모델을 Hub에 통합하고 Inference API 및 위젯 지원 추가

Welcome PaddlePaddle to the Hugging Face Hub

2023년 1월 17일6intermediate

Context

PaddlePaddle은 2016년 Baidu에서 오픈소스로 공개한 딥러닝 프레임워크로, 텍스트, 이미지, 오디오, 비디오 및 멀티모달 모델들이 여러 라이브러리에 분산되어 있었다. 개발자들이 PaddlePaddle의 다양한 사전학습 모델에 쉽게 접근하고 활용할 수 있는 통합 플랫폼이 필요했다.

Technical Solution

  • Hugging Face Hub에 PaddlePaddle 라이브러리 태그 필터링 지원 추가: 모델 찾기 및 검색 기능 구현
  • PaddleNLP를 선도로 하여 PaddlePaddle 라이브러리들을 Hub와 점진적으로 통합: 향후 다른 라이브러리도 순차적 통합 계획
  • Inference API를 통한 모델 접근 제공: HTTP 기반 cURL, Python requests 라이브러리 등으로 호출 가능하게 구현
  • 브라우저 내 대화형 위젯 구현: 특정 작업을 지원하는 모델에 대해 직접 테스트 가능한 인터페이스 제공
  • PaddleNLP의 save_to_hf_hub 메서드 추가: 사용자가 자신의 모델을 Hub에 푸시할 수 있도록 지원
  • PaddlePaddle Spaces 제공: Ernie-ViLG(텍스트-이미지), UIE-X(크로스모달 정보 추출), PaddleOCR(다언어 OCR) 등의 실행 가능한 환경 구성

Impact

Hub 상에 75개 이상의 PaddlePaddle 모델이 이미 등재됨. ERNIE 3.0(중국어 최고 수준 언어 모델), UIE(멀티태스크 정보 추출 시리즈), Ernie-Layout(문서 레이아웃 지식 강화 사전학습 모델) 등이 활용 가능한 상태.

Key Takeaway

오픈소스 프레임워크의 모델 생태계를 중앙화된 허브 플랫폼과 통합하면, 개발자 진입장벽을 낮추고 재사용 가능한 모델의 접근성과 배포 편의성을 동시에 향상시킬 수 있다.


PaddlePaddle 기반 프로젝트를 진행하는 팀에서 Hugging Face Hub의 Inference API와 from_hf_hub=True 파라미터를 활용하면, 모델 로딩 및 추론 코드를 표준화하고 별도의 모델 서빙 인프라 구축 없이 HTTP 기반으로 즉시 프로덕션 배포할 수 있다.

원문 읽기