피드로 돌아가기
I let my AI agent provision cloud infra. Then I made sure it couldn't go bankrupt doing it.
Dev.toDev.to
Security

Deterministic Action Firewall을 통한 AI 에이전트의 클라우드 비용 폭주 및 파괴적 행위 원천 차단

I let my AI agent provision cloud infra. Then I made sure it couldn't go bankrupt doing it.

Vasu Dalal2026년 6월 26일3intermediate

Context

IAM 권한을 가진 AI 에이전트가 정당한 권한 내에서 대규모 인스턴스를 생성하거나 네트워크 스캔을 수행함에 따라 발생하는 비용 폭증 및 보안 리스크 직면. LLM 기반의 판단은 지연 시간 발생과 신뢰성 부족으로 인해 실시간 제어 장치로 부적합한 한계 존재.

Technical Solution

  • LLM을 배제한 Zero-LLM Gateway 설계를 통한 Latency 제거 및 결정론적(Deterministic) 제어 구현
  • 행위의 정당성을 기준으로 'Hard-block'과 'Human-in-the-loop' 두 가지 제어 경로 분리
  • 네트워크 스캔과 같은 명백한 공격 행위는 실행 전 단계에서 즉시 차단하는 Deterministic Block 적용
  • 프로비저닝과 같이 상황에 따라 정당성이 갈리는 행위는 202 Accepted 응답 후 예산 소유자의 승인을 받는 Escalation 구조 설계
  • Action Firewall을 통해 커버 가능한 실패 유형과 모델 내부의 Hallucination 등 커버 불가능한 유형을 명확히 구분하여 신뢰성 확보
  • SDK 데코레이터 패턴을 활용하여 비즈니스 로직 진입 전 인터셉터 단계에서 유해 쿼리 및 명령어를 필터링하는 구조 채택

1. AI 에이전트의 권한 제어 시 Identity 기반의 허용보다는 실행 결과(Consequence) 기반의 게이트웨이 설계 검토

2. 실시간 차단 로직에서 LLM 판단을 제거하여 추론 지연 및 우회 가능성 차단

3. 무조건적인 차단 대신, 비용 발생 가능성이 있는 고위험 작업에 대해 Human-in-the-loop 승인 프로세스 도입

4. 에이전트가 수행하는 작업의 실패 유형을 분류하고, 결정론적으로 방어 가능한 영역에 대해 우선적으로 Action Firewall 구축

원문 읽기