피드로 돌아가기
I built a circuit breaker for LLM agents after seeing someone lose $200 overnight
Dev.toDev.to
AI/ML

LLM Agent의 무한 루프와 예산 낭비를 차단하는 Circuit Breaker 구현

I built a circuit breaker for LLM agents after seeing someone lose $200 overnight

BOSS_METALLIQUE2026년 6월 3일8intermediate

Context

기존 Observability 도구들이 사후 분석 중심의 'Security Camera' 역할에 그쳐 실시간 비용 폭증과 잘못된 Tool 호출을 제어하지 못하는 한계 존재. 특히 LangChain의 기본 Recursion Limit(9999)과 같은 설정 오류로 인한 급격한 비용 손실 위험이 큼.

Technical Solution

  • Python Decorator 패턴을 통한 Tool Dispatcher 인터셉터 구조 설계
  • Escalation → Loop → Budget 순의 계층적 검증 파이프라인 구축으로 리소스 소모 최소화
  • json.dumps(sort_keys=True)와 SHA-256을 결합한 Structural Hashing 기법으로 인자 순서 변경에 관계없는 루프 탐지 구현
  • 비용 집계가 아닌 실행 전 예상 비용을 계산하는 Projected Cost 모델 적용으로 예산 초과 전 즉각 차단
  • Fail-closed 원칙을 적용하여 검증 서버 통신 장애 시 모든 Tool 호출을 중단하는 안전 설계
  • 개발자 경험(DX) 향상을 위해 Async 강제가 아닌 동기/비동기 모두 호환되는 단순 Wrapper 구조 채택

- LLM Tool 호출부 전단에 실행 전 검증(Pre-execution Validation) 레이어 도입 검토 - 단순 문자열 비교 대신 정렬된 JSON 기반의 Structural Hashing으로 중복 호출 탐지 - 안전 장치 설계 시 'Fail-open'이 아닌 'Fail-closed' 전략을 통해 최악의 상황 방지 - 사후 모니터링 대시보드와 별개로 실시간 런타임 제어 장치(Circuit Breaker) 구축

원문 읽기