Dev.toBootstrap Resampling을 통한 LLM Eval Metric의 통계적 신뢰 구간 확보Bootstrap confidence intervals for your LLM eval metricsAI/MLintermediate11 분 소요2026년 6월 24일