피드로 돌아가기
Dev.toInfrastructure
원문 읽기
Tranco-1M 분석을 통한 이메일 인프라 점유율 37.94%의 실체 규명
The state of email infrastructure: what 660K DNS records reveal in 2026
AI 요약
Context
Google과 Microsoft가 비즈니스 이메일 시장을 독점한다는 일반적 인식과 실제 인프라 데이터 간의 괴리 존재. 기존의 폐쇄적 데이터셋이나 일회성 학술 연구만으로는 실시간으로 변화하는 글로벌 이메일 생태계의 전체 구조를 파악하기 어려운 한계점 보유.
Technical Solution
- OpenINTEL의 Tranco top-1M 일일 DNS 스냅샷을 활용한 Apache Parquet 기반 데이터 파이프라인 구축
- MX 레코드의 최저 우선순위 타겟을 분석하여 메일박스 제공자를 식별하는 80여 개의 정규표현식 매칭 로직 설계
- SPF 레코드 내 include 구문을 통해 ESP 및 SaaS 발신자를 추적하는 다층적 분류 체계 적용
- DMARC 레코드의 p, sp, pct 필드를 파싱하여 실제 보안 강제 적용 여부를 판별하는 Enforcement 검증 프로세스 도입
- 분류되지 않은 Unknown 타겟을 로그로 남겨 딕셔너리를 지속적으로 업데이트하는 반복적 정제 루프 구현
Impact
- Google(21.7%)과 Microsoft(16.3%)의 합산 점유율이 37.94%에 불과함을 데이터로 증명
- 전체 도메인의 50.03%가 Unknown 및 Generic 호스팅 패턴에 분포함을 확인
- DMARC 레코드의 20.3%가 p=none 설정으로 인해 실질적인 보호 기능이 작동하지 않는 상태임을 식별
Key Takeaway
전체 시장의 지배적 사업자 중심의 가설보다 DNS 레코드와 같은 로우 레벨의 정량적 데이터 분석을 통한 실태 파악이 시스템 설계 및 보안 전략 수립에 더 정확한 근거를 제공함.
실천 포인트
- DMARC 설정 시 p=none 상태의 방치 여부와 reporting endpoint 설정 상태를 점검할 것 - SPF 레코드 내 include 체인으로 인한 DNS lookup 횟수 초과 및 Flattening 이슈를 검토할 것 - MX 레코드의 CNAME Unrolling을 통해 실제 메일 서버의 최종 목적지를 정확히 식별할 것