AI Agent에 Adversarial Reasoning을 주입하는 SKILLS.md 프레임워크 설계

Turning Your AI Into an Adversarial Security Agent: The SKILLS.md Framework

Shubham2026년 6월 7일11분advanced

AI 요약

Context

AI Coding Assistant가 구현 속도와 기능적 정답에만 최적화되어 BOLA, SSRF, Race Condition과 같은 설계 결함을 양산하는 한계 직면. 단순한 보안 체크리스트는 공격자의 Assumption 파괴 전략을 방어하지 못하는 구조적 문제 존재.

Agent Skills Standard 기반의 skills/<skill-name>/SKILL.md 구조를 통한 보안 추론 컨텍스트의 영구적 주입
YAML Frontmatter의 Semantic Metadata를 활용하여 API 생성 및 인증 설계 시 보안 리뷰 스킬을 자동 활성화하는 트리거 설계
'구현 전 남용 분석(Abuse Analysis)' 단계를 강제하여 기능 구현 중심의 워크플로우를 Adversarial 관점으로 전환
State Change 트리거 감지 시 SELECT ... FOR UPDATE와 같은 Row-level Isolation 적용을 강제하는 내부 추론 루프 구축
User-controlled URL 패턴 감지 시 Egress Proxy 및 Domain Allowlist 구현을 전제 조건으로 설정하는 가드레일 설계

실천 포인트

1. AI Agent의 시스템 프롬프트나 Skill 설정에 '기능 구현 전 남용 시나리오(Abuse Case) 도출' 단계 명시

2. 상태 변경 API 설계 시 Race Condition 방지를 위한 동시성 제어 전략(Idempotency-Key, Locking) 검토 강제

3. 외부 리소스 요청 로직 구현 시 SSRF 방지를 위한 Egress Filtering 및 Allowlist 적용 여부 확인

4. AI 생성 코드 리뷰 시 '기능적 정답'이 아닌 '설계적 가정(Assumption)'의 취약점 분석 수행

태그