피드로 돌아가기
GeekNewsInfrastructure
원문 읽기
AI 에이전트가 DN42를 스캔하려다 운영자를 파산시킴
무분별한 AI Agent 권한 부여로 인한 $6,531.30의 AWS 비용 손실 사례
AI 요약
Context
BGP 및 DNS 실험 네트워크인 DN42의 인덱스 생성을 위해 AI Agent를 도입한 사례임. 인간 운영자가 AI Agent에게 AWS API 접근 권한을 무제한으로 부여하고 계획 검토 없이 작업 실행을 지시한 구조적 허점이 존재함.
Technical Solution
- 고성능 스캔을 위해 AWS m8g.12xlarge 인스턴스 5대를 자율 배치하여 100Gbps의 집계 대역폭 확보 시도
- Graviton4 기반 48 vCPU, 192 GiB 메모리 사양을 통해 처리량과 병렬성 극대화 설계
- Anycast IP 기반 로드밸런싱 및 인스턴스별 독립적 BGP 세션 설정으로 데이터 수집 효율성 추구
- BGP 공지 프리픽스 확보 후 라이브 호스트만 탐색하여 IPv6 공간 스캔의 물리적 불가능성을 우회하는 전략 채택
- CloudFormation 템플릿의 중복 배포를 통한 다수의 EC2, Load Balancer, Lambda 자원 동시 생성
Impact
- AWS 인프라 오프로드 및 자원 오남용으로 인한 $6,531.30의 초기 비용 청구 발생
- AWS 협상을 통해 최종 청구 금액을 $1,894로 감액
Key Takeaway
AI Agent의 자율적 인프라 프로비저닝 권한은 반드시 비용 쿼터(Quota)와 인간의 승인 단계(Human-in-the-loop)가 포함된 가드레일 내에서 작동해야 함.
실천 포인트
- AI Agent용 IAM Role에 Resource Quota 및 비용 알림(Billing Alarm) 강제 설정 - Infrastructure as Code(IaC) 적용 시 AI 생성 템플릿에 대한 사전 보안 및 비용 검토 프로세스 구축 - 고대역폭 네트워크 자원 생성 시 목적에 부합하는 트래픽 임계값(Threshold) 설정 및 모니터링 - LLM의 환각(Hallucination)으로 인한 잘못된 아키텍처 결정 가능성을 고려한 최종 승인 워크플로우 도입