GitHub Stars 조작 패턴 분석을 통한 TrustStar 검증 프레임워크 설계

We Scanned 100 AI Repos on GitHub. Here's What We Found.

TrustStar2026년 6월 2일4분intermediate

AI 요약

Context

GitHub Stars를 신뢰도의 Proxy로 사용하는 개발자 관습을 이용한 인위적 지표 조작 사례 증가. 단순 Star 수치만으로는 실제 프로젝트의 건전성과 코드의 정통성을 판별할 수 없는 한계 발생.

Technical Solution

Account Quality(26%), Temporal Behavior(23%), Project Health(26%), Authenticity(25%)의 4가지 차원 기반 다각도 스코어링 모델 설계
GitHub API를 통한 Star 획득 타임스탬프 분석으로 1초 미만의 동시성 요청을 처리하는 Multi-threaded Bot 패턴 식별
Fork/Star Ratio 분석을 통해 실제 코드 기여도와 단순 관심도 간의 상관관계 검증 및 이상치 탐지
8개 이상의 수렴 신호(Convergent Signals)가 포착될 때만 DANGEROUS 레이블을 부여하는 엄격한 판별 임계값 설정
Commit 빈도와 Star 증가율의 비동기적 패턴을 추적하여 Activity-less Growth 상태의 인위적 팽창 탐지

Impact

1,485개의 Star가 90분 내에 집중된 Typosquatting 공격 패턴 포착
특정 윈도우 내 Star 쌍의 27.3%가 5초 이내 간격으로 생성된 Bot 계정 활동 검증
88.9%~91.9%에 달하는 Lockstep Ratio 분석을 통한 정교한 조작 계정 군집 식별

Key Takeaway

단일 메트릭 기반의 신뢰 모델은 조작 가능성이 높으므로, 시계열 데이터 분석과 다차원 상관관계 검증을 통한 입체적 Trust Scoring 체계 구축 필요

실천 포인트

- 오픈소스 라이브러리 도입 전 Commit History와 Star 증가 추이의 동기화 여부 확인 - Fork/Star Ratio가 극단적으로 낮은 경우 실제 사용성 의심 - 계정 생성일과 Star 급증 시점의 간격을 분석하여 Supply Chain Attack 가능성 검토

태그

#Anomaly Detection #Supply Chain Attack #Typosquatting #GitHub API #Trust Scoring

원문 읽기