피드로 돌아가기
Hugging Face BlogBackend
원문 읽기
Hugging Face가 DataCite와 파트너십을 통해 모델과 데이터셋에 DOI(Digital Object Identifier) 생성 기능을 제공하여 연구 커뮤니티에서의 인용 및 영구 참조 가능
Introducing DOI: the Digital Object Identifier to Datasets and Models
AI 요약
Context
머신러닝 모델과 데이터셋의 재현성, 문서화, 공유 측면에서 학술 커뮤니티 표준인 DOI 부재로 인해 영구적 참조 메커니즘이 없었다.
Technical Solution
- DataCite와의 파트너십을 통해 DOI 할당 체계 구축: 등록된 Hub 사용자가 저장소 설정에서 직접 DOI 요청 가능
- 메타데이터 기반 DOI 관리: 모델/데이터셋의 URL, 버전, 생성 날짜, 설명 등을 DOI에 연결하여 추적 가능
- 버전 관리 기능 지원: 새로운 버전 생성 시 기존 DOI는 outdated 처리되고 새로운 DOI 할당으로 특정 버전 참조 보장
- Hub 페이지 UI에 "Cite this model/dataset" 버튼 추가: 클릭으로 즉시 인용 정보 표시
- DOI 획득 모델/데이터셋에 대한 영구 보존 정책: 삭제 요청 시 지원팀에 신청 필요하도록 관리
Key Takeaway
학술 커뮤니티의 표준 인증 체계(DOI)를 ML 모델과 데이터셋에 적용하면, 연구 재현성을 강화하고 학술적 신뢰도를 확보할 수 있다.
실천 포인트
머신러닝 모델과 데이터셋을 학술 논문이나 연구에 활용하는 데이터 과학자/연구팀은 Hugging Face Hub에서 DOI를 발급받으면 ISBN처럼 작동하는 영구 참조 링크를 확보하여 다른 연구자들이 정확한 버전의 리소스를 인용하도록 강제할 수 있다.