피드로 돌아가기
Dev.toAI/ML
원문 읽기
Vertex AI 기반 Cloud-native 구조의 AI 추천 시스템 구축
How I Built and Shipped a Production-Ready AI Recommendation System (Nomova.ai)
AI 요약
Context
파편화된 여행 정보 탐색으로 인한 사용자 인지 부하 증가 및 개인화 추천 부재 문제를 해결해야 하는 상황. 단순 모델 개발을 넘어 확장성과 유지보수성을 갖춘 Production-ready 환경 구축이 필요했음.
Technical Solution
- ML Layer, Feature Processing Layer, Serving Infrastructure의 Separation of Concerns 설계를 통한 독립적 반복 개발 환경 구축
- Vertex AI 도입을 통한 Managed Deployment Workflow 확보 및 추론 워크로드의 자동 Scaling 구현
- raw 데이터를 구조적 신호로 변환하는 Feature Processing Layer 분리로 모델과 입력 복잡도의 Decoupling 달성
- PyTorch 기반 예측 모델과 Vertex AI Serving Endpoint의 결합을 통한 모델 라이프사이클 관리 효율화
- Cold Start 문제 해결을 위한 Fallback Logic 설계를 통해 신규 사용자 대상 추천 일관성 확보
실천 포인트
1. ML 모델과 Feature Pipeline을 물리적으로 분리하여 모델 변경 시 데이터 전처리 로직의 영향도 최소화 여부 검토
2. 인프라 관리 오버헤드 감소를 위해 Vertex AI와 같은 Managed ML Platform 도입 검토
3. 신규 사용자 유입 시나리오를 대비한 Fallback 추천 전략 수립