피드로 돌아가기
Discovering PII Inside InterSystems IRIS
Dev.toDev.to
Security

Embedded Python 기반 In-Database PII 탐지로 데이터 외부 유출 제로 달성

Discovering PII Inside InterSystems IRIS

InterSystems Developer2026년 6월 16일15intermediate

Context

기존 PII 탐지 방식은 데이터 추출 후 외부 분석 도구로 전송하는 구조로 인해 GDPR, HIPAA 등 규제 준수 시 데이터 전송 구간의 보안 취약점 발생. 데이터 주권 보장 및 외부 프로세스 전송에 따른 컴플라이언스 리스크 해결을 위한 구조적 변화 필요.

Technical Solution

  • Compute-to-Data 원칙 적용을 통한 InterSystems IRIS 내부 Embedded Python 기반 분석 환경 구축
  • PIIIdentifier, PIIScanner, PIIReporter로 구성된 3계층 Decoupled Architecture 설계를 통한 분석 엔진의 독립성 확보
  • Microsoft Presidio 및 spaCy 라이브러리를 Wrapper 패턴으로 캡슐화하여 탐지 엔진 교체 가능성 확보
  • INFORMATION_SCHEMA.TABLES 쿼리를 통한 대상 테이블 자동 식별 및 SELECT TOP N 기반의 데이터 샘플링 최적화
  • Schema Exclusion Pattern(와일드카드 포함) 적용을 통한 분석 범위 제어 및 불필요한 오버헤드 제거
  • Confidence Score(0.0~1.0) 기반의 구조화된 CSV 리포팅을 통한 False Positive 검토 프로세스 효율화

1. 민감 데이터 분석 시 데이터 이동을 최소화하는 In-Database 분석 가능 여부 검토

2. 분석 라이브러리와 데이터 접근 로직을 완전히 분리하여 엔진 교체 비용 최소화

3. 전수 조사 대신 전략적 샘플링과 Confidence Score를 조합한 검토 파이프라인 구축

4. 규제 준수를 위해 데이터 전송 단계 자체를 제거하는 Zero-Transmission 설계 고려

원문 읽기