피드로 돌아가기
StuckLoopDetection: How We Stopped an Agent Burning $12 on 47 Identical Calls
Dev.toDev.to
AI/ML

StuckLoopDetection 도입으로 에이전트 무한 루프 비용 95% 절감

StuckLoopDetection: How We Stopped an Agent Burning $12 on 47 Identical Calls

Kacper Włodarczyk2026년 4월 13일3intermediate

Context

LLM 에이전트가 도구 호출 결과의 파싱 실패 시 동일 작업을 반복하는 Mechanical Repetition 발생. System Prompt를 통한 제어는 Cognitive Load 증가에 따른 준수율 저하와 에이전트별 개별 설정의 번거로움이라는 한계 존재.

Technical Solution

  • Capability 레벨에서 루프 탐지 로직을 구현하여 모델의 인지 능력과 독립적인 강제 제어 계층 설계
  • 동일 인자 및 결과가 반복되는 Identical Calls, A-B-A-B 형태의 Alternating 패턴, 상태 변화 없는 No-Op 루프의 3가지 패턴 정의
  • 기본 임계값(Threshold=3) 초과 시 ModelRetry를 유발하는 warn 액션 또는 프로세스를 즉시 종료하는 StuckLoopError의 error 액션 선택 구조 채택
  • for_run() 메커니즘을 통한 Per-Run Isolation 구현으로 병렬 실행 시 상태 간섭 방지 및 스레드 안전성 확보
  • 모델의 자가 인지에 의존하지 않고 외부 관찰자(Observer) 관점에서 루프를 감지하여 Pivot을 유도하는 제어 흐름 구축

1. 에이전트 도구 호출 시 동일 인자-결과 쌍의 반복 횟수를 카운팅하는 인터셉터 구현 검토

2. 루프 탐지 시 단순 에러 종료보다 '현재 상황'을 명시한 피드백을 모델에 전달하여 경로 수정을 유도하는 Retry 전략 수립

3. 병렬 에이전트 실행 환경에서 상태 저장소가 Run ID 단위로 격리되어 있는지 확인

원문 읽기