피드로 돌아가기
OpenAI Privacy Filter 소개
GeekNewsGeekNews
AI/ML

OpenAI Privacy Filter 소개

F1 97.43% 달성, 1.5B 파라미터 기반 고효율 로컬 PII 필터링 모델

xguru2026년 4월 27일10advanced

Context

기존 정규표현식 기반 PII 탐지 방식의 낮은 문맥 인식력과 고정된 규칙 의존성으로 인한 탐지 누락 문제 발생. 데이터 전송 과정에서의 프라이버시 노출 위험을 제거하기 위해 서버리스 환경이 아닌 로컬 실행 가능한 고성능 비식별화 구조 필요.

Technical Solution

  • Autoregressive 사전학습 체크포인트 기반의 Token-classification head 교체를 통한 효율적 모델 전이 학습 설계
  • 단일 Forward Pass로 입력 시퀀스 전체를 라벨링하는 양방향 토큰 분류 및 Constrained Viterbi 절차를 통한 일관된 Span 복원 구조 채택
  • 128,000 토큰의 광범위한 Context Window 지원으로 긴 문서 내의 문맥 의존적 PII 판별 능력 확보
  • 1.5B 전체 파라미터 중 50M의 활성 파라미터만 사용하는 경량 구조 설계를 통한 로컬 추론 최적화
  • BIOES Span Tagging 방식을 적용하여 마스킹 경계의 정밀도와 일관성 향상
  • 공개 데이터와 합성 데이터를 혼합한 학습 전략으로 희소한 프라이버시 패턴 및 도메인 다양성 대응

Impact

  • PII-Masking-300k 벤치마크에서 F1 96%(정밀도 94.04%, 재현율 98.04%) 달성
  • 데이터 주석 보정 버전 기준 F1 97.43%(정밀도 96.79%, 재현율 98.08%) 기록
  • 소량 데이터 기반 Domain Adaptation 수행 시 F1 스코어를 54%에서 96%로 대폭 향상

Key Takeaway

특정 도메인의 정밀한 탐지를 위해 거대 모델의 Generative 능력 대신 Token Classification과 Span Decoding을 결합한 전용 구조를 설계하여 추론 속도와 정확도의 Trade-off를 최적화함.


- PII 탐지 시 단순 정규식-모델 하이브리드 파이프라인 구축 검토 - LLM 응답 복원을 위한 역치환(Rehydration) 메커니즘 설계 반영 여부 확인 - 도메인별 특화된 PII 라벨 Taxonomy 정의 및 소량 데이터 미세조정 수행 - CPU-only 추론 가능 여부를 위한 모델 파라미터 및 활성 파라미터 규모 검증

원문 읽기