개인화 추천 시스템 1편 - 유저의 행동은 “언어”일까? : Collaborative Embedding 구축기 (feat. Knowledge Distillation)

컬리가 RQ-VAE 기반 Semantic ID와 Transformer 기반 Dual-Head Architecture를 결합해 개인화 추천 시스템을 구축하고 CRM 캠페인 클릭률 55.6% 향상 달성

2025년 11월 26일12분advanced

AI 요약

Context

커머스 플랫폼에서 수만 개의 상품과 다양한 사용자 행동 패턴으로 인해, 단순 상품 속성만으로는 정확한 개인화 추천이 어렵습니다. 기존 협업 필터링은 콜드 스타트 문제로 신규 유저·상품 추천이 불가능했고, 순차 추천 모델은 추론 시 전체 Vocabulary에 대한 확률 계산으로 인해 실시간 환경에서 높은 지연시간을 초래했습니다.

Technical Solution

상품 텍스트를 RQ-VAE로 압축: 상품 상세정보를 다단계 Codebook으로 구조화하여 Semantic ID라는 고정 길이 코드 시퀀스로 변환하고, 범주 예측 Auxiliary Head로 Regularization 적용
Transformer Encoder 기반 유저 임베딩 구축: 유저 행동 시퀀스를 Sequential Recommendation 패턴으로 모델링하여 비슷한 취향의 유저끼리 가까운 Collaborative Space 형성
Dual-Head Architecture 도입: 하나의 공유 Encoder에서 Generative Head(다음 구매 상품 확률 분포 생성)와 Retrieval Head(벡터 유사도 기반 고속 후보 검색)를 동시 학습하여 정확도와 속도 트레이드오프 해결
Knowledge Distillation 적용: 학습 단계에서는 Generative Head로 정밀한 신호를 학습하고, 서빙 단계에서는 Retrieval Head를 활용하여 추론 비용 절감
신규 상품 콜드 스타트 해결: Semantic ID는 텍스트 정보만으로 즉시 생성 가능하여 신규 상품이 등록되면 자동으로 추천 후보에 포함

Impact

CRM 캠페인(앱 푸시, 인앱 메시지) A/B 테스트에서 클릭률(CTR) 55.6% 증가
온라인 A/B 테스트에서 비교적 좋은 성과 확인(구체적 수치 미명시)

Key Takeaway

다양한 행동 패턴을 포착하는 개인화 추천 시스템은 상품 속성(Content Space)과 사용자 행동(Collaborative Space)을 독립적으로 정의하고 연계하는 설계가 핵심입니다. 정확도와 서빙 속도의 트레이드오프는 단일 모델에서 서로 다른 목적의 두 헤드를 동시 학습하는 Dual-Head Architecture로 해결할 수 있습니다.

실천 포인트

대규모 커머스 플랫폼에서 순차 추천 모델을 운영할 때, Generative Head로 학습하고 Retrieval Head로 서빙하는 Dual-Head 구조를 도입하면 추론 지연시간을 줄이면서도 사용자 취향을 정밀하게 반영할 수 있습니다. 또한 RQ-VAE를 통해 상품 텍스트를 계층적 코드북으로 구조화하면, 신규 상품도 추천 대상으로 즉시 포함할 수 있어 콜드 스타트 문제를 동시에 해결합니다.

태그

#Transformer #Collaborative Filtering #Knowledge Distillation #Embedding #recommendation system

원문 읽기