피드로 돌아가기
Dev.toAI/ML
원문 읽기
Bregman Information 기반의 범용 Bias-Variance 분해를 통한 OOD 탐지 성능 개선
Uncertainty Estimates of Predictions via a General Bias-Variance Decomposition
AI 요약
Context
기존 Bias-Variance Decomposition은 Squared Error에만 국한되어 Log-loss나 Brier score 같은 Proper Scoring Rules에 적용 불가능한 한계 존재. 특히 Softmax Confidence는 Dataset Shift 상황에서 신뢰도가 급격히 하락하여 모델의 Uncertainty를 정확히 측정하지 못하는 문제 발생.
Technical Solution
- Strictly Proper Scoring Rule과 Bregman Divergence의 수학적 대응 관계를 활용한 일반화된 분해 공식 설계
- Bregman Information을 일반화된 Variance 지표로 정의하여 다양한 Loss 함수에 대응하는 불확실성 측정 체계 구축
- Log-sum-exp(LSE) 함수를 통해 Binary Classification의 Logit Space에서 Variance를 제어하는 구조 구현
- Convex Conjugate 및 Dual Space 개념을 도입하여 Squared Bias를 계산하는 이론적 프레임워크 수립
- 정규성 가정이 필요 없는 Logit Space 기반의 Confidence Region 생성 로직 설계
- Ensemble 및 MC Dropout을 통해 여러 예측값을 샘플링하여 Bregman Information을 추정하는 연산 프로세스 적용
실천 포인트
- Softmax 확률값만으로 모델 신뢰도를 판단하지 말고 Logit Space의 분산을 분석할 것 - 모델의 Uncertainty 측정 시 Ensemble이나 MC Dropout을 통해 예측 분포의 Bregman Information을 계산해볼 것 - Dataset Shift가 예상되는 환경에서는 Log-loss 기반의 Bias-Variance 분해를 통해 OOD 데이터 필터링 전략을 검토할 것
태그