피드로 돌아가기
Dev.toAI/ML
원문 읽기
ML 모델 없이 통계적 시그널만으로 Recall 96% 달성한 Hallucination 탐지 설계
I Got 96% Recall on LLM Hallucination Detection With No ML Model – Just 50 Lines of Python
AI 요약
Context
SelfCheckGPT 등 기존 탐지 방식의 과도한 Compute 비용과 Black-box 구조로 인한 디버깅 난해함이 병목으로 작용. RAG 파이프라인 내에서 추론 비용을 최소화하면서도 판단 근거가 명확한 결정론적 검증 체계 필요성 증대.
Technical Solution
- Length Ratio 분석을 통한 모델의 답변 패딩 경향성 및 정보 밀도 측정
- Unknown Word Rate 산출로 Reference Text 대비 외부 정보 개입 여부 판별
- Question-Answer Overlap 계산을 통해 소스 참조 없는 단순 질문 반복 패턴 식별
- Numeric Inconsistency 검증으로 날짜, 수치 등 고위험 데이터의 정합성 체크
- 4개 시그널에 개별 Threshold를 적용하여 0~4점의 통합 Score로 수치화
- Risk Tolerance에 따라 Soft/Strict Flag로 이원화한 가변적 Threshold 전략 채택
실천 포인트
- RAG 시스템 도입 시 Source Knowledge와 Answer 간의 단어/수치 일치도 측정 로직 검토 - 비즈니스 도메인의 위험도에 따라 Recall 중심(Soft) 또는 Precision 중심(Strict)의 Threshold 설정 - 모델의 답변 길이와 참조 문서 길이의 비율을 통해 Hallucination 가능성 사전 스크리닝