피드로 돌아가기
A Survey and Taxonomy of Graph Sampling
Dev.toDev.to
AI/ML

대규모 Graph 데이터 처리의 핵심, Graph Sampling 체계적 분석

A Survey and Taxonomy of Graph Sampling

Paperium2026년 4월 9일1advanced

Context

거대 Graph 데이터의 전체 연산은 과도한 메모리와 계산 자원 소모 유발. 전체 데이터셋을 학습에 사용하는 방식의 확장성 한계 직면. 효율적인 모델 학습을 위해 데이터의 대표성을 유지하며 크기를 줄이는 샘플링 전략 필요.

Technical Solution

  • 노드 중심, 엣지 중심, 서브그래프 중심의 샘플링 기법으로 분류한 Taxonomy 설계
  • Random Walk 기반의 로컬 구조 보존 전략으로 그래프의 위상적 특성 유지
  • Node-wise 샘플링을 통한 배치 처리 효율성 및 메모리 사용량 최적화
  • Layer-wise 및 Subgraph-wise 접근법을 통한 Graph Neural Networks(GNN)의 계산 복잡도 해소
  • 샘플링 편향 제거를 위한 가중치 조정 및 재샘플링 알고리즘 적용
  • 데이터 분포의 왜곡을 최소화하는 정밀한 샘플링 기준 수립

Key Takeaway

데이터 규모와 모델 목적에 맞는 샘플링 전략 선택이 학습 속도와 모델 정확도의 Trade-off를 결정하는 핵심 설계 요소임.


GNN 모델 설계 시 메모리 부족 현상이 발생하면 Node-wise 샘플링부터 단계적으로 적용하여 최적의 Batch Size를 탐색할 것

원문 읽기