피드로 돌아가기
토스 기술블로그AI/ML
원문 읽기
얼굴 인식의 역사와 페이스페이의 미래
LFW 99.63% 달성 및 4,200만 장 데이터 정제를 통한 얼굴 인식의 진화
AI 요약
Context
초기 얼굴 인식 시스템은 수동 좌표 입력 방식과 조명 변화에 취약한 이미지 분석 구조라는 한계를 가짐. 특히 단순 이미지 매칭 방식은 실제 환경의 Lighting 변화와 각도 차이로 인해 낮은 인식률을 기록함.
Technical Solution
- PCA 기반 Eigenfaces 도입을 통한 고차원 얼굴 데이터를 저차원 통계적 공간으로 표현
- LBP(Local Binary Pattern) 적용으로 절대 밝기가 아닌 픽셀 간 상대적 질감 분석을 통한 조명 강인성 확보
- SVM 및 AdaBoost 결합을 통해 최적의 결정 경계면을 구축하고 분류 성능을 고도화
- Deep Neural Network 기반 특징 자동 추출 구조로 전환하여 Hand-crafted Feature의 한계 극복
- Triplet Loss 및 ArcFace 등의 Loss 함수 설계를 통한 임베딩 공간 내 클래스 간 거리 최적화
- 대규모 데이터셋 정제 파이프라인 구축을 통한 모델 일반화 성능 및 정확도 극대화
Impact
- DeepFace 도입 후 LFW 벤치마크 정확도 97.35% 달성
- FaceNet의 Triplet Loss 적용으로 LFW 정확도 99.63% 기록하며 인간 수준 초과
- WebFace260M 프로젝트를 통해 2억 6천만 장의 원본에서 4,200만 장의 정제 데이터셋 구축
Key Takeaway
도메인 지식 기반의 특징 설계(Hand-crafted)에서 데이터 주도형 특징 학습(Deep Learning)으로의 전환과, 손실 함수(Loss Function)의 정교한 설계가 모델의 변별력을 결정하는 핵심 요소임.
실천 포인트
1. 조명 및 환경 변화가 심한 입력 데이터 처리 시 절대값이 아닌 상대적 패턴(Local Feature) 분석 검토
2. 모델 성능 정체 시 단순 파라미터 튜닝보다 데이터 정제(Data Cleaning) 및 스케일 확장 우선 고려
3. 분류 문제 해결 시 단순 Cross Entropy 외에 임베딩 공간의 거리를 최적화하는 Metric Learning 기반 Loss 함수 검토