피드로 돌아가기
InfoQAI/ML
원문 읽기
Graph 기반 ML Asset 관리로 전사적 Lineage 추적 및 재사용성 극대화
Netflix Introduces ‘Model Lifecycle Graph’ to Scale Enterprise Machine Learning
AI 요약
Context
전사 규모의 ML 시스템 확장에 따른 데이터셋, Feature, Pipeline 간의 복잡도 증가로 운영 효율 저하. 개별 Pipeline 중심의 관리 방식으로는 상위 의존성 파악 및 변경 영향도 분석에 한계 노출.
Technical Solution
- ML Asset과 관계를 First-class Infrastructure로 정의한 Model Lifecycle Graph 아키텍처 설계
- Dataset, Feature, Model, Evaluation, Workflow를 상호 연결된 Node로 모델링한 Graph 구조 도입
- Pipeline 단계별 선형 구조를 탈피하여 다대다(N:M) 의존 관계를 Traverse 가능한 형태의 Lineage로 구현
- Metadata 중심의 플랫폼 설계를 통한 ML Asset의 Discoverability 및 Governance 체계 강화
- 중앙 집중식 관리가 아닌 Self-service 접근 방식을 통한 개별 엔지니어의 Asset 발견 및 재사용 프로세스 구축
- 전사적 인프라 가시성 확보를 위한 Institutional Visibility 중심의 설계 지향
실천 포인트
1. ML Asset 간의 의존성을 단순 리스트가 아닌 Graph 구조로 매핑하여 영향도 분석 프로세스 구축
2. 개별 파이프라인 최적화보다 Asset 간의 Lineage 추적 가능성에 우선순위를 둔 메타데이터 설계 검토
3. 재사용 가능한 Feature 및 Model의 발견을 위한 Self-service 포털 또는 Catalog 도입 고려
태그