피드로 돌아가기
I Got 96% Recall on LLM Hallucination Detection With No ML Model – Just 50 Lines of Python
Dev.toDev.to
AI/ML

ML 모델 없이 통계적 시그널만으로 Recall 96% 달성한 Hallucination 탐지 설계

I Got 96% Recall on LLM Hallucination Detection With No ML Model – Just 50 Lines of Python

Ritika2026년 5월 25일5intermediate

Context

SelfCheckGPT 등 기존 탐지 방식의 과도한 Compute 비용과 Black-box 구조로 인한 디버깅 난해함이 병목으로 작용. RAG 파이프라인 내에서 추론 비용을 최소화하면서도 판단 근거가 명확한 결정론적 검증 체계 필요성 증대.

Technical Solution

  • Length Ratio 분석을 통한 모델의 답변 패딩 경향성 및 정보 밀도 측정
  • Unknown Word Rate 산출로 Reference Text 대비 외부 정보 개입 여부 판별
  • Question-Answer Overlap 계산을 통해 소스 참조 없는 단순 질문 반복 패턴 식별
  • Numeric Inconsistency 검증으로 날짜, 수치 등 고위험 데이터의 정합성 체크
  • 4개 시그널에 개별 Threshold를 적용하여 0~4점의 통합 Score로 수치화
  • Risk Tolerance에 따라 Soft/Strict Flag로 이원화한 가변적 Threshold 전략 채택

- RAG 시스템 도입 시 Source Knowledge와 Answer 간의 단어/수치 일치도 측정 로직 검토 - 비즈니스 도메인의 위험도에 따라 Recall 중심(Soft) 또는 Precision 중심(Strict)의 Threshold 설정 - 모델의 답변 길이와 참조 문서 길이의 비율을 통해 Hallucination 가능성 사전 스크리닝

원문 읽기