피드로 돌아가기
실제 팩트체크에서 프런티어 LLM 간 불일치
GeekNewsGeekNews
AI/ML

실제 팩트체크에서 프런티어 LLM 간 불일치

Frontier LLM 5종 간 67%의 판정 불일치 및 시스템적 불안정성 확인

xguru2026년 5월 29일16advanced

Context

실제 사용자 제출 클레임을 활용해 최상위 LLM들의 팩트체크 일관성을 측정함. 기존 벤치마크와 달리 정답 라벨이 없는 실제 환경에서 모델 간 판정 구조의 불안정성을 분석하여 LLM을 단일 판정자로 신뢰할 수 있는지 검증함.

Technical Solution

  • 4단계 순서형 루브릭(True, Mostly True, Misleading, False)을 정의하여 판정 범주 간 거리 기반의 불일치 측정 체계 설계
  • Krippendorff’s α(ordinal) 지표를 도입하여 모델 간 합의 수준을 정량적으로 산출
  • '버킷 거리(Bucket Distance)' 개념을 통해 단순 불일치와 실질적 불일치(2칸 이상 차이)를 구분하는 분석 로직 적용
  • 기반 모델 공유 여부에 따른 일치율 분석을 통해 모델 아키텍처 유사성이 판정 일관성에 미치는 영향 파악
  • 영역별(Finance, Tech 등) 불일치율을 전수 조사하여 도메인 특성에 따른 판정 편차 식별

- LLM 판정 결과 활용 시 단일 모델 의존도를 낮추고 다양한 기반 모델을 조합한 Ensemble 구조 검토 - 판정 범주 설계 시 뉘앙스 차이(거리 1)와 실질적 오류(거리 2 이상)를 구분하는 가중치 시스템 적용 - 도메인별(특히 법률, 금융) 불일치율이 높으므로 특정 영역 전용 Ground Truth 데이터셋 구축 및 검증 프로세스 도입

원문 읽기