피드로 돌아가기
Dev.toAI/ML
원문 읽기
HTTP 상태 코드 기반 추론을 배제한 증거 중심 Root Cause 분석 시스템 도입
How we stopped our AI assistant from hallucinating bug fixes
AI 요약
Context
AI 코딩 어시스턴트가 HTTP 상태 코드(500, 404 등)만으로 장애 원인을 추측하여 정상적인 핸들러를 잘못 수정하는 Hallucination 발생. 동일한 증상(빈 배열 반환 등)에 대해 DB 미생성, Feature Flag 오프 등 최소 6가지 이상의 상이한 원인이 존재함에도 Ground Truth 부재로 인한 무분별한 코드 수정 반복.
Technical Solution
- OpenAPI 및 소스 코드 파싱을 통한 Route Graph 생성으로 애플리케이션 구조 자동 분석
- HTTP/SSE/WS 엔드포인트를 직접 타격하여 실제 요청, 응답 샘플, 타이밍 데이터를 수집하는 증거 기반 Probe 메커니즘 구축
- 수집된 데이터를 25가지 Root Cause 카테고리에 매핑하고 신뢰도(High, Medium, None)를 산출하는 결정론적 규칙 기반 분류기 설계
- 신경망 기반 Black Box 추론을 배제하고 투명한 Rule 및 엔드포인트별 통계 메모리를 통한 검증 가능한 결과 도출
- MCP(Model Context Protocol) 인터페이스를 통해 AI 어시스턴트에 8가지 도구를 제공하여 추측이 아닌 증거 기반의 추론 유도
실천 포인트
- AI에게 단순히 오류 메시지를 전달하는 대신, 검증 가능한 런타임 데이터(Evidence)를 함께 제공하는 구조 설계 - 상태 코드와 같은 표면적 지표가 아닌, 데이터베이스 상태나 설정 값 등 실제 원인을 식별할 수 있는 프로빙 단계 추가 - AI의 판단을 맹신하지 않고 결과의 Falsifiability(반증 가능성)를 확보하기 위한 로그 및 근거 데이터 매칭 체계 구축