피드로 돌아가기
Why Heuristic Detectors Beat LLMs at Finding Agent Failures
Dev.toDev.to
AI/ML

Heuristic 기반 검출기로 LLM 대비 정확도 5배 향상 및 비용 제로 달성

Why Heuristic Detectors Beat LLMs at Finding Agent Failures

Tuomo Nikulainen2026년 5월 15일5intermediate

Context

AI Agent의 실패 분석 시 LLM-as-judge 방식을 채택하는 일반적 추세의 한계 분석. 복잡한 Trace 데이터에서 LLM의 추론 능력이 오히려 낮은 정확도와 높은 비용, 지연 시간을 초래하는 병목 지점으로 작용.

Technical Solution

  • 구조적 시그니처 분석을 통한 20가지 core rule-based detector 설계
  • Hash comparison 기반의 state repetition 측정을 통한 Loop 및 Resource Abuse 탐지
  • 입력값의 핵심 요소(숫자, 날짜, 고유명사) 추출 및 출력값과의 overlap 측정을 통한 Context neglect 검출
  • Tool call 성공률과 source-output 일치 여부를 대조하여 Hallucination 식별
  • Synonym 및 stem matching 기반의 Keyword coverage 측정으로 Specification mismatch 판별
  • Heuristics를 1차 필터로 사용하고 Semantic reasoning이 필요한 Attribution 단계에만 LLM을 배치하는 Tiered Pipeline 구조 채택

- Agent Failure 분석 시 LLM 도입 전, 상태 반복이나 도구 성공률 등 측정 가능한 구조적 지표 정의 여부 검토 - 고비용 LLM 호출을 최소화하기 위해 Deterministic한 Rule-based 필터를 전처리 단계에 배치 - Multi-agent 시스템의 책임 소재 분석(Attribution)과 같은 Semantic 추론 영역만 LLM Judge에게 할당

원문 읽기