피드로 돌아가기
Day 4: Create a Standard ML Project Structure
Dev.toDev.to
AI/ML

ML 프로젝트 유지보수성 향상을 위한 표준 디렉토리 구조 및 패키징 설계

Day 4: Create a Standard ML Project Structure

Thu Kha Kyawe2026년 6월 3일4beginner

Context

개별 개발자마다 상이한 ML 프로젝트 레이아웃으로 인한 협업 효율 저하 및 코드 관리의 어려움 발생. 표준화된 구조의 부재로 인해 모듈 간 의존성 파악이 어렵고 재현성 확보에 한계가 있는 상황.

Technical Solution

  • 데이터 생애주기에 따른 data/raw 및 data/processed 분리 구조 설계를 통한 데이터 무결성 보장
  • 실험적 분석을 위한 notebooks와 프로덕션 코드인 src를 격리하여 코드 베이스의 순도 유지
  • src 하위 모듈에 init.py 파일을 강제 배치하여 Python Package 인식을 통한 모듈형 Import 구조 구현
  • Feature Engineering, Model Training, Utility 함수를 도메인별로 세분화한 src 하위 디렉토리 설계
  • requirements.txt 내 scikit-learn, pandas, numpy, mlflow 명시를 통한 환경 재현성 및 의존성 일관성 확보
  • 프로젝트 식별자 중심의 README.md 표준화를 통한 문서화 컨벤션 수립

- ML 프로젝트 시작 시 데이터 전처리-특징 추출-모델링 단계별 디렉토리 분리 여부 검토 - 소스 코드 폴더 내 __init__.py 배치를 통한 패키지 구조화 확인 - PyPI 공식 패키지 명칭(예: sklearn 대신 scikit-learn) 사용 여부 체크 - 원천 데이터(Raw)와 가공 데이터(Processed)의 물리적 경로 분리 적용

원문 읽기