StuckLoopDetection 도입으로 에이전트 무한 루프 비용 95% 절감

StuckLoopDetection: How We Stopped an Agent Burning $12 on 47 Identical Calls

Kacper Włodarczyk2026년 4월 13일3분intermediate

AI 요약

Context

LLM 에이전트가 도구 호출 결과의 파싱 실패 시 동일 작업을 반복하는 Mechanical Repetition 발생. System Prompt를 통한 제어는 Cognitive Load 증가에 따른 준수율 저하와 에이전트별 개별 설정의 번거로움이라는 한계 존재.

Capability 레벨에서 루프 탐지 로직을 구현하여 모델의 인지 능력과 독립적인 강제 제어 계층 설계
동일 인자 및 결과가 반복되는 Identical Calls, A-B-A-B 형태의 Alternating 패턴, 상태 변화 없는 No-Op 루프의 3가지 패턴 정의
기본 임계값(Threshold=3) 초과 시 ModelRetry를 유발하는 warn 액션 또는 프로세스를 즉시 종료하는 StuckLoopError의 error 액션 선택 구조 채택
for_run() 메커니즘을 통한 Per-Run Isolation 구현으로 병렬 실행 시 상태 간섭 방지 및 스레드 안전성 확보
모델의 자가 인지에 의존하지 않고 외부 관찰자(Observer) 관점에서 루프를 감지하여 Pivot을 유도하는 제어 흐름 구축

실천 포인트

1. 에이전트 도구 호출 시 동일 인자-결과 쌍의 반복 횟수를 카운팅하는 인터셉터 구현 검토

2. 루프 탐지 시 단순 에러 종료보다 '현재 상황'을 명시한 피드백을 모델에 전달하여 경로 수정을 유도하는 Retry 전략 수립

3. 병렬 에이전트 실행 환경에서 상태 저장소가 Run ID 단위로 격리되어 있는지 확인

태그