Stateless Proxy 기반 PII Redaction으로 LLM 데이터 유출 차단 및 비용 60% 절감

I Built an Open-Source AI Firewall Because Every LLM App Leaks Data

Binu George2026년 5월 8일4분intermediate

AI 요약

Context

LLM 애플리케이션의 프롬프트 내 PII(개인식별정보)가 필터링 없이 LLM Provider로 전송되는 보안 취약점 발생. 기존 애플리케이션 계층의 필터링 부재로 인한 데이터 유출 및 Agent Loop로 인한 API 비용 폭증 문제 직면.

Technical Solution

App과 LLM Provider 사이에 위치한 Stateless Proxy 아키텍처 설계를 통한 데이터 비저장 원칙 준수
Presidio 및 Custom NER 모델을 레이어링하여 Regex 한계를 극복한 28종 이상의 PII Entity 탐지 로직 구현
Vision Model 대응을 위한 OCR Pipeline 구축으로 이미지 내 텍스트 추출 및 실시간 PII 스캔 프로세스 적용
API Key별 Hard Spend Cap 설정 및 HTTP 402 응답 제어를 통한 무한 루프 비용 손실 방지
600개 이상의 모델 가격 데이터를 기반으로 최저가 모델로 요청을 배정하는 Smart Cost Routing 엔진 탑재
OpenAI SDK의 base_url 변경만으로 통합 가능한 투명한 프록시 계층 설계로 구현 복잡도 제거

실천 포인트

- LLM 프롬프트 내 PII 탐지 시 단순 Regex가 아닌 NER(Named Entity Recognition) 모델 병행 검토 - LLM Agent 도입 시 예상치 못한 비용 폭증 방지를 위한 API Gateway 레벨의 Hard Limit 설정 - 보안 민감도가 높은 프록시 솔루션 도입 시 소스 코드 검증이 가능한 Open Source 기반의 Self-hosting으로 신뢰성 확보 - 이미지 입력 기능 포함 시 OCR 단계의 Latency가 전체 사용자 경험에 미치는 영향 분석

태그

#Cost Routing #Prompt Injection #PII Redaction #NER #Stateless Proxy

원문 읽기