피드로 돌아가기
Dev.toAI/ML
원문 읽기
TorchGeo 도입을 통한 Multi-spectral 위성 데이터 처리 최적화 및 83.7% 정확도 달성
Getting Started with TorchGeo — Remote Sensing with PyTorch
AI 요약
Context
일반적인 Computer Vision 라이브러리가 PNG 기반의 RGB 데이터에 최적화되어 GeoTIFF와 같은 고해상도 위성 데이터 처리에 한계 노출. Coordinate Reference System 결여 및 Random Cropping으로 인한 지리적 패턴 손실 문제가 병목 지점으로 작용.
Technical Solution
- Geo-aware Sampler 도입을 통한 대규모 GeoTIFF 파일의 지리적 맥락 유지 및 효율적 Tiling 구현
- 13개 Sentinel-2 Bands를 처리하는 Multi-spectral Tensor 구조 설계를 통한 분석 정밀도 향상
- Torchvision 및 PyTorch Lightning과의 Seamless Integration을 통한 기존 DL 파이프라인 유지
- Custom collate_fn 설계를 통한 Dictionary 형태의 지리 데이터셋을 Tensor Batch로 변환하는 전처리 로직 구축
- ImageNet Pre-trained Weights 기반의 ResNet18 전이 학습을 통한 학습 수렴 속도 최적화
Impact
- RTX 4060(8GB) 환경에서 3 Epoch 학습만으로 40초 만에 Test Accuracy 83.7% 달성
- 590k 규모의 BigEarthNet 등 50개 이상의 Remote Sensing Dataset에 대한 즉각적인 접근성 확보
실천 포인트
1. 위성 이미지 처리 시 RGB 외 Multi-spectral Band 유지 필요성 검토
2. 지리적 패턴 유지를 위해 일반 Random Crop 대신 Geo-aware Sampling 적용
3. 대규모 GeoTIFF 처리 시 Memory 효율을 위한 Tiling 전략 수립
4. 도메인 특화 데이터셋의 경우 전이 학습 모델의 FC Layer 커스텀 설계 적용