피드로 돌아가기
AgentThreatBench: The First OWASP Agentic Top 10 Security Benchmark
Dev.toDev.to
Security

OWASP Top 10 기반 Agentic AI 보안 벤치마크 AgentThreatBench 공개

AgentThreatBench: The First OWASP Agentic Top 10 Security Benchmark

Vaishnavi Gudur2026년 5월 19일4advanced

Context

기존 LLM 평가 체계가 단순 입출력 기반의 Prompt-Level 검증에 치중하여 외부 환경과 상호작용하는 Agent의 취약점 분석에 한계 노출. 특히 RAG 문서나 API 응답 등 외부 데이터에 포함된 Indirect Prompt Injection을 통한 Goal Hijacking 위험 증가.

Technical Solution

  • Inspect AI 프레임워크 기반의 실행 가능한 보안 태스크 구현으로 OWASP Agentic Top 10 표준 구체화
  • Memory Poisoning 시나리오 설계를 통한 Append-style 및 Replacement-style 공격 대응력 검증
  • Autonomy Hijack 구조 설계를 통한 도구 호출 결과값 내 악성 페이로드의 실행 여부 측정
  • Data Exfiltration 시나리오를 통한 민감 정보의 비인가 Third-party 유출 경로 차단 검증
  • Utility와 Security를 동시에 측정하는 Dual-Metric Scoring 도입으로 과잉 거부(Over-refuse)와 취약성 간의 Trade-off 분석

- Agent 설계 시 외부 Tool의 반환값을 신뢰하지 않는 Zero Trust 아키텍처 적용 검토 - Indirect Prompt Injection 방지를 위한 입력 데이터 정제 및 런타임 Guardrail 계층 추가 - 보안성 강화를 위해 Utility Metric과 Security Metric을 동시에 측정하는 자체 평가 파이프라인 구축

원문 읽기