피드로 돌아가기
토스 기술블로그AI/ML
원문 읽기
2,800만 MAU를 이해하는 유저 Segmentation, TUES
2,800만 MAU 분석을 위한 NMF 기반 Soft Clustering 유저 세그먼테이션 설계
AI 요약
Context
서비스 다변화에 따른 유저 행동 패턴의 복합성 증가로 단순 서비스 이용 여부 기반의 MECE 분석 한계 직면. 기존 K-Means 기반 Hard Clustering 방식은 유저를 단일 세그먼트에만 할당하여 실제 다중 서비스 이용 패턴을 반영하지 못하는 설계적 결함 존재.
Technical Solution
- '앱 오픈 시 이용 확률'에서 '앱 오픈 1회당 이용 횟수'로 Feature를 변경하여 유저의 이용 깊이(Depth) 측정 가능 구조 설계
- K-Means(Hard Clustering)를 NMF(Non-negative Matrix Factorization) 기반 Soft Clustering으로 교체하여 유저별 세그먼트 소속 확률을 산출하는 복합성 반영 구조 도입
- '서비스별 관여도 → 앱 전체 관여도 → 주 이용 서비스'로 이어지는 3계층(3-Layer) 세그먼트 구조를 설계하여 유저 배치 사유의 추적 가능성 확보
- 정량적 분석 결과에 전략적 해석을 더한 Rule-based 각색 과정을 통해 도메인 지식과 데이터 모델의 정렬 최적화
- 사내 마케팅 툴인 TUBA와 세그먼트 데이터를 연동하여 분석 결과가 즉각적인 타겟 마케팅 액션으로 이어지는 파이프라인 구축
실천 포인트
- 유저 행동이 다변화된 플랫폼 환경에서는 단일 그룹 할당보다 소속 확률을 계산하는 Soft Clustering 검토 - 단순 이용 여부(Binary)보다는 이용 빈도(Frequency) 및 깊이(Depth)를 Feature로 정의하여 데이터 해상도 확보 - 모델의 결과물을 그대로 사용하지 않고 비즈니스 도메인에 맞게 Rule-based로 재정의하는 포스트 프로세싱 단계 추가 - 분석 프레임워크 설계 시 '전체 지표 → 그룹별 지표 → 개별 특성'으로 이어지는 계층 구조를 설계하여 분석의 드릴다운 경로 확보