Bregman Information 기반의 범용 Bias-Variance 분해를 통한 OOD 탐지 성능 개선

Uncertainty Estimates of Predictions via a General Bias-Variance Decomposition

Kasiuk Vadim2026년 5월 14일10분advanced

AI 요약

Context

기존 Bias-Variance Decomposition은 Squared Error에만 국한되어 Log-loss나 Brier score 같은 Proper Scoring Rules에 적용 불가능한 한계 존재. 특히 Softmax Confidence는 Dataset Shift 상황에서 신뢰도가 급격히 하락하여 모델의 Uncertainty를 정확히 측정하지 못하는 문제 발생.

Technical Solution

Strictly Proper Scoring Rule과 Bregman Divergence의 수학적 대응 관계를 활용한 일반화된 분해 공식 설계
Bregman Information을 일반화된 Variance 지표로 정의하여 다양한 Loss 함수에 대응하는 불확실성 측정 체계 구축
Log-sum-exp(LSE) 함수를 통해 Binary Classification의 Logit Space에서 Variance를 제어하는 구조 구현
Convex Conjugate 및 Dual Space 개념을 도입하여 Squared Bias를 계산하는 이론적 프레임워크 수립
정규성 가정이 필요 없는 Logit Space 기반의 Confidence Region 생성 로직 설계
Ensemble 및 MC Dropout을 통해 여러 예측값을 샘플링하여 Bregman Information을 추정하는 연산 프로세스 적용

실천 포인트

- Softmax 확률값만으로 모델 신뢰도를 판단하지 말고 Logit Space의 분산을 분석할 것 - 모델의 Uncertainty 측정 시 Ensemble이나 MC Dropout을 통해 예측 분포의 Bregman Information을 계산해볼 것 - Dataset Shift가 예상되는 환경에서는 Log-loss 기반의 Bias-Variance 분해를 통해 OOD 데이터 필터링 전략을 검토할 것

태그

#Logit Space #Out-of-Distribution #Bias-Variance Decomposition #Bregman Divergence #Proper Scoring Rules

원문 읽기