Meta EngineeringMeta가 적응형 순위 모델을 활용해 LLM 규모의 추천 시스템을 100ms 지연 시간으로 서빙하는 추론 효율화 기법을 공개했다Meta Adaptive Ranking Model: Bending the Inference Scaling Curve to Serve LLM-Scale Models for AdsAI/MLadvanced31 분 소요2026년 3월 31일