피드로 돌아가기
Found a Second Layer to a GitHub Follow Botnet?
Dev.toDev.to
Security

Jaccard Similarity 및 Artifact 분석을 통한 GitHub Botnet 탐지

Found a Second Layer to a GitHub Follow Botnet?

GnomeMan42012026년 5월 21일18intermediate

Context

교차 팔로우 탐지를 회피하는 정교한 GitHub Botnet의 활동 패턴 분석. 단순 계정 생성을 넘어 대규모 저장소를 자동 생성하는 정형화된 파이프라인의 흔적 식별.

Technical Solution

  • Jaccard Similarity 분석을 통해 팔로잉 리스트 유사도 0.99 이상의 계정 9개를 클러스터링한 이상 징후 탐지
  • README 내 숨겨진 HTML Comment의 Timestamp와 Job ID를 분석하여 34분 만에 552개 저장소를 생성한 동시성 기반 배포 구조 파악
  • Job ID의 비순차적 패턴을 통해 단일 프로세스가 아닌 Job Queue 기반의 분산 워커(Multiple Workers) 아키텍처 추론
  • 모든 저장소의 README 내 LICENSE URL이 특정 계정(mariwatts)으로 하드코딩된 Template Substitution Error를 통한 동일 생성기 확인
  • fallback_ 접두어 분석을 통해 주 생성 경로 실패 시 정적 템플릿을 대체하는 Template Generation System의 동작 방식 식별
  • [Word][Suffix] 패턴의 저장소 명명 규칙과 기능 없는 Stub 코드 구조를 통한 AI 기반 자동 생성 파이프라인 증명

1. 자동화 템플릿 설계 시 하드코딩된 식별자나 고유 접두어가 포함되었는지 검토

2. 대규모 데이터 생성 파이프라인의 Job ID 할당 전략이 외부로 노출되어 인프라 구조를 추론하게 하는지 확인

3. API 기반의 유사도 분석(Jaccard Similarity 등)을 통한 비정상 계정 클러스터링 모니터링 도입

원문 읽기