Logprobs 기반 Entropy 분석을 통한 LLM 모델별 Calibration 성능 검증

LLM guesses or knows

Alex2026년 6월 14일1분intermediate

AI 요약

Context

LLM이 생성한 답변의 확신도와 실제 정답 여부 사이의 상관관계를 정량적으로 판별할 필요성 제기. 단순 텍스트 결과물이 아닌 모델 내부의 확률 분포를 분석하여 Guessing과 Knowing을 구분하는 메커니즘 탐색.

실천 포인트

1. Agentic Workflow 설계 시 Temperature를 0으로 설정하여 재현성 확보

2. 단순 응답값이 아닌 Logprobs를 추출하여 임계값 기반의 Confidence Score 필터링 도입

3. 입력 데이터를 그대로 출력하는 Copying 패턴 발생 시 Entropy가 낮아지는 왜곡 현상 주의

태그