MediaPipe 기반 자동 레이블링으로 300장의 이미지에서 1,800개의 학습 데이터 확보

No Dataset? No Problem. How I Curated a Custom AI Dataset From Instagram & Pinterest to Build a Pose Suggester

SHAIK TAUFEEQ AHMAD2026년 5월 19일4분intermediate

AI 요약

Context

배경 장소에 따른 최적의 포즈를 추천하는 Pose Suggester 구현을 위해 라이프스타일 장소와 미적 포즈가 매핑된 데이터셋 필요. 기존 Kaggle이나 Hugging Face 내 관련 오픈소스 데이터셋 부재로 인한 자체 데이터 큐레이션 및 파이프라인 설계가 요구됨.

Technical Solution

분류 오차 최소화를 위해 Cafe, Nature, Urban 3개 환경과 Full Body, Waist Up 2개 프레이밍으로 구성된 엄격한 Taxonomy 정의
특정 인플루언서 편향 제거 및 Scene Classifier의 Overfitting 방지를 위해 신체 조건과 배경 다양성을 확보한 데이터 소싱
수동 좌표 지정의 비효율성을 해결하고자 MediaPipe Pose Landmarker를 활용한 Joint Coordinate 자동 추출 및 JSON 직렬화 파이프라인 구축
MobileNetV2의 Overfitting 방지를 위해 albumentations 기반의 Brightness, Contrast, Blur 증강 기법 적용
Horizontal Flip 적용 시 발생하는 좌우 Joint Index 반전 문제를 해결하기 위한 레이블 스왑 로직 구현

실천 포인트

1. 데이터셋 설계 시 환경과 프레이밍을 정의한 엄격한 Taxonomy 수립

2. 수동 레이블링 대신 Pre-trained 모델을 활용한 Auto-labeling 파이프라인 검토

3. 이미지 Flip 등 기하학적 증강 시 대응하는 레이블 인덱스 변경 로직 포함 여부 확인

4. 학습 모델의 규모(MobileNetV2 등)에 맞는 최소 데이터 샘플 수 계산 및 증강 전략 수립

태그

#Computer Vision #Data-Augmentation #Pose Estimation #MobileNetV2 #MediaPipe

원문 읽기