Local-First 설계로 데이터 유출 제로를 실현한 AI 데이터 필터링 익스텐션

I Built a Browser Extension That Catches Your Secrets Before AI Does

Defyzzz2026년 4월 11일7분intermediate

AI 요약

Context

AI 챗봇 사용 시 API Key 및 DB Connection String과 같은 민감 정보가 외부 서버로 유출되는 보안 리스크 존재. 기존 SaaS 기반 스캔 도구는 검사를 위해 데이터를 다시 클라우드로 전송해야 하는 역설적 구조로 인해 신뢰성 확보에 한계 노출.

Local-First 아키텍처 설계를 통한 데이터 외부 전송 원천 차단 및 브라우저 내 독립적 처리 구조 구현
window.fetch 및 XMLHttpRequest Monkey-patching 기법을 적용하여 AI 플랫폼의 파일 업로드 요청을 인터셉트하는 프록시 로직 구축
30개 이상의 정규표현식(Regex) 패턴과 BERT 기반 NER(Named Entity Recognition) 모델을 병행 사용하여 탐지 정밀도 향상
BERT 모델의 대소문자 무시 특성을 해결하기 위해 분석 전 텍스트 정규화 및 분석 후 원문 맵핑 프로세스 도입
PDF.js 활용 시 발생하는 비선형 텍스트 추출 문제를 Y좌표 우선 정렬 알고리즘을 통해 읽기 순서로 재구성
Manifest V3 기반의 최소 권한(storage, host_permissions) 설계를 통해 공격 표면(Attack Surface) 최소화

실천 포인트

1. 민감 정보 처리 로직 설계 시 데이터 전송 경로를 완전히 제거할 수 있는 Local-First 가능 여부 검토

2. 외부 라이브러리(fetch 등)의 동작을 제어해야 할 경우 Monkey-patching을 통한 인터셉터 계층 구현 고려

3. NLP 모델 도입 시 Tokenizer의 특성과 대소문자 민감도 등 전처리 단계의 데이터 정규화 전략 수립

태그