피드로 돌아가기
Introducing DOI: the Digital Object Identifier to Datasets and Models
Hugging Face BlogHugging Face Blog
Backend

Hugging Face가 DataCite와 파트너십을 통해 모델과 데이터셋에 DOI(Digital Object Identifier) 생성 기능을 제공하여 연구 커뮤니티에서의 인용 및 영구 참조 가능

Introducing DOI: the Digital Object Identifier to Datasets and Models

2022년 10월 7일5beginner

Context

머신러닝 모델과 데이터셋의 재현성, 문서화, 공유 측면에서 학술 커뮤니티 표준인 DOI 부재로 인해 영구적 참조 메커니즘이 없었다.

Technical Solution

  • DataCite와의 파트너십을 통해 DOI 할당 체계 구축: 등록된 Hub 사용자가 저장소 설정에서 직접 DOI 요청 가능
  • 메타데이터 기반 DOI 관리: 모델/데이터셋의 URL, 버전, 생성 날짜, 설명 등을 DOI에 연결하여 추적 가능
  • 버전 관리 기능 지원: 새로운 버전 생성 시 기존 DOI는 outdated 처리되고 새로운 DOI 할당으로 특정 버전 참조 보장
  • Hub 페이지 UI에 "Cite this model/dataset" 버튼 추가: 클릭으로 즉시 인용 정보 표시
  • DOI 획득 모델/데이터셋에 대한 영구 보존 정책: 삭제 요청 시 지원팀에 신청 필요하도록 관리

Key Takeaway

학술 커뮤니티의 표준 인증 체계(DOI)를 ML 모델과 데이터셋에 적용하면, 연구 재현성을 강화하고 학술적 신뢰도를 확보할 수 있다.


머신러닝 모델과 데이터셋을 학술 논문이나 연구에 활용하는 데이터 과학자/연구팀은 Hugging Face Hub에서 DOI를 발급받으면 ISBN처럼 작동하는 영구 참조 링크를 확보하여 다른 연구자들이 정확한 버전의 리소스를 인용하도록 강제할 수 있다.

원문 읽기