피드로 돌아가기
Understanding Linear Regression: A Foundation of Machine Learning
Dev.toDev.to
AI/ML

Ordinary Least Squares 기반 연속형 수치 예측 Baseline 모델 설계

Understanding Linear Regression: A Foundation of Machine Learning

Tarun Kumar2026년 6월 3일4beginner

Context

데이터 간 상관관계 분석 및 연속형 수치 예측을 위한 기본 모델의 필요성 대두. 복잡한 모델 도입 전 데이터의 선형성 확인과 빠른 벤치마크 수립을 위한 경량 알고리즘 요구됨.

Technical Solution

  • Ordinary Least Squares(OLS) 기법을 통한 실제값과 예측값의 잔차 제곱합 최소화 로직 설계
  • 단일 변수 기반 Simple Linear Regression 및 다중 변수 기반 Multiple Linear Regression 구조 채택
  • Linearity 및 Homoscedasticity 등 5가지 통계적 가정을 통한 모델 신뢰성 확보
  • Scikit-Learn 라이브러리를 활용한 학습 및 예측 파이프라인의 단순화
  • MAE, MSE, RMSE 및 R-Squared 지표를 통한 모델 성능의 정량적 평가 체계 구축

- 입력 변수 간 높은 상관관계가 존재하는 Multicollinearity 발생 여부 검토 - 데이터셋 내 Outlier가 회귀선에 미치는 영향 분석 및 전처리 수행 - R-Squared 수치를 통한 모델의 설명력 확인 및 Non-linear 관계 존재 시 고도화 모델 검토

원문 읽기