피드로 돌아가기
How Missing Data Analysis Lab uses Flask, Bayesian optimization, and MongoDB in one regression workflow
Dev.toDev.to
AI/ML

Flask 기반 통합 파이프라인을 통한 Missing-data 분석 및 Regression 최적화 구현

How Missing Data Analysis Lab uses Flask, Bayesian optimization, and MongoDB in one regression workflow

Sangeeth Macherla2026년 4월 28일6intermediate

Context

단순 Notebook 기반의 ML 실험 방식으로는 데이터 업로드부터 최적화, 결과 시각화까지의 전체 워크플로우 재현성이 낮음. 분석-모델링-전달 과정이 파편화되어 연구 결과의 비교 분석과 대시보드 제공에 병목 발생.

Technical Solution

  • Flask Runtime 중심의 API 레이어와 Frontend 통합을 통한 단일 Application Boundary 구축
  • Optuna 기반 Bayesian Optimization 도입으로 Hyperparameter 튜닝의 자동화 및 효율성 확보
  • Validation-first Scoring 규칙 적용을 통한 Test-set 과적합 방지 및 모델 선택 신뢰도 향상
  • MongoDB를 활용한 실험 이력 및 데이터셋 Persistence 레이어 설계로 분석 결과의 영속성 보장
  • In-memory Fallback 구조 채택으로 DB 연결 상태와 무관한 유연한 런타임 환경 제공
  • Results 디렉토리 기반의 Artifacts 생성 및 정적 파일 서빙 구조를 통한 분석 결과의 시각적 해석력 강화

- ML 실험 도구 설계 시 Analysis-Modeling-Visualization을 하나의 Application Boundary로 묶어 재현성 확보 - 단순 Test-set 성능 기반 선택이 아닌 Validation set 중심의 모델 선정 프로세스 구축 - ML 결과물(Plot, Metric)을 Artifacts 파일로 분리 저장하여 런타임 없이도 대시보드 조회가 가능하도록 설계

원문 읽기