피드로 돌아가기
InfoQAI/ML
원문 읽기
OpenSearch LTR 통합을 통한 Autocomplete 지연시간 최소화 및 랭킹 정교화
Swiggy Improves Search Autocomplete Using Real Time Machine Learning Ranking
AI 요약
Context
키스트로크마다 발생하는 쿼리로 인한 극심한 Latency 민감도 해결 필요. 기존 Hand-tuned Heuristic 방식의 정적 랭킹 규칙으로 인한 검색 정확도 한계 노출.
Technical Solution
- Candidate Generation과 Ranking 단계의 분리를 통한 Recall 최적화 및 정밀 재정렬 구조 설계
- OpenSearch LTR 내부에 ML 모델을 직접 배치하여 추가적인 Network Hop 제거 및 추론 속도 확보
- Feature Store 도입을 통한 Precomputed 및 Streaming Feature 제공으로 실시간 연산 비용 절감
- RankLib 및 XGBoost 기반의 Learning-to-Rank 모델을 활용한 사용자 행동 기반의 동적 랭킹 구현
- Click-through Rate와 Conversion 데이터를 Streaming Pipeline으로 처리하는 Continuous Feedback Loop 구축
- 모델 복잡도와 서빙 효율성 간의 Trade-off 분석을 통한 Lightweight Model 채택으로 응답성 유지
실천 포인트
- 초저지연 서비스에서 ML 추론 시 외부 API 호출 대신 검색 엔진 내부 LTR 플러그인 검토 - Candidate Generation(High Recall)과 Ranking(High Precision)의 2단계 파이프라인 적용 - 실시간 피처 연산 부하 감소를 위해 Feature Store 기반의 전처리 데이터 캐싱 전략 수립 - 정적 룰 기반 시스템에서 ML 기반 시스템으로 전환 시 Model Registry를 통한 배포 자동화 구성