피드로 돌아가기
Dev.toAI/ML
원문 읽기
MediaPipe 기반 자동 레이블링으로 300장의 이미지에서 1,800개의 학습 데이터 확보
No Dataset? No Problem. How I Curated a Custom AI Dataset From Instagram & Pinterest to Build a Pose Suggester
AI 요약
Context
배경 장소에 따른 최적의 포즈를 추천하는 Pose Suggester 구현을 위해 라이프스타일 장소와 미적 포즈가 매핑된 데이터셋 필요. 기존 Kaggle이나 Hugging Face 내 관련 오픈소스 데이터셋 부재로 인한 자체 데이터 큐레이션 및 파이프라인 설계가 요구됨.
Technical Solution
- 분류 오차 최소화를 위해 Cafe, Nature, Urban 3개 환경과 Full Body, Waist Up 2개 프레이밍으로 구성된 엄격한 Taxonomy 정의
- 특정 인플루언서 편향 제거 및 Scene Classifier의 Overfitting 방지를 위해 신체 조건과 배경 다양성을 확보한 데이터 소싱
- 수동 좌표 지정의 비효율성을 해결하고자 MediaPipe Pose Landmarker를 활용한 Joint Coordinate 자동 추출 및 JSON 직렬화 파이프라인 구축
- MobileNetV2의 Overfitting 방지를 위해 albumentations 기반의 Brightness, Contrast, Blur 증강 기법 적용
- Horizontal Flip 적용 시 발생하는 좌우 Joint Index 반전 문제를 해결하기 위한 레이블 스왑 로직 구현
실천 포인트
1. 데이터셋 설계 시 환경과 프레이밍을 정의한 엄격한 Taxonomy 수립
2. 수동 레이블링 대신 Pre-trained 모델을 활용한 Auto-labeling 파이프라인 검토
3. 이미지 Flip 등 기하학적 증강 시 대응하는 레이블 인덱스 변경 로직 포함 여부 확인
4. 학습 모델의 규모(MobileNetV2 등)에 맞는 최소 데이터 샘플 수 계산 및 증강 전략 수립