피드로 돌아가기
Sentence Transformers in the Hugging Face Hub
Hugging Face BlogHugging Face Blog
Backend

Hugging Face Hub가 Sentence Transformers v2 통합으로 90개 이상의 사전학습 모델과 위젯, Inference API를 지원하면서 임베딩 모델 공유 및 배포의 진입장벽 제거

Sentence Transformers in the Hugging Face Hub

2021년 6월 28일6beginner

Context

Sentence Transformers 프레임워크는 의미론적 임베딩 생성에 유용하지만, 학습된 모델을 커뮤니티와 공유하고 시각적으로 테스트할 수 있는 표준화된 방법이 부족했다.

Technical Solution

  • Sentence Transformers v2를 Hugging Face Hub와 통합: 모델을 model.save_to_hub("model_name") 한 줄의 코드로 업로드 가능
  • Feature-extraction 위젯 추가: 입력 문장의 임베딩 벡터를 시각적으로 표시
  • Sentence similarity 위젯 추가: 소스 문장과 여러 문장 간의 유사도를 계산하는 위젯 제공
  • Inference API 엔드포인트 제공: 프로그래매틱하게 모델을 호출할 수 있는 HTTP API 구현
  • 자동 모델 카드 생성: 아키텍처, 사용법, 모델 필터링 메타데이터를 자동으로 생성

Impact

100개 이상의 언어를 지원하는 90개 이상의 사전학습 Sentence Transformers 모델이 Hub에 배포됨.

Key Takeaway

임베딩 모델의 공유 및 활용 진입장벽을 낮추기 위해서는 단순한 업로드 기능뿐 아니라 대화형 위젯과 표준화된 API를 함께 제공하는 것이 중요하다.


Sentence Transformers를 사용하는 NLP 엔지니어는 `save_to_hub()` 메서드를 통해 학습 완료 모델을 Hub에 1줄의 코드로 배포한 후, 자동으로 생성된 위젯과 Inference API로 즉시 데모 및 프로덕션 추론을 지원할 수 있다.

원문 읽기