LLM 10종 중 3종의 Role Confusion 취약점 및 XML 기반 Prompt Injection 확인

I Sent the Same Prompt Injection to Ten LLMs. Three Complied.

The Skills Team2026년 4월 11일5분intermediate

AI 요약

Context

LLM이 시스템 구분자와 사용자 입력 태그를 구분하지 못하는 파싱 취약점으로 인해 발생하는 Role Confusion 문제 분석. 공격자가 XML 태그를 사용하여 사용자 입력을 시스템 명령어로 오인하게 만들어 내부 컨텍스트와 비밀 정보를 유출시키는 보안 허점 존재.

실천 포인트

1. 사용자 입력값 내 <SYSTEM>, <NOTE> 등 시스템 예약어와 유사한 태그 포함 여부 검토

2. Chat Completion API 사용 시 Role 필드를 명확히 분리하여 Content 내 주입 공격 방지

3. DLP(Data Loss Prevention) 도구가 JSON 구조화 데이터 내의 민감 정보 유출을 탐지하는지 확인

4. LLM 추론 전 단계에서 경량화된 분류 모델(SVM 등)을 통한 Prompt Injection 필터링 레이어 검토

태그