GeekNews유휴 Inference GPU Pool을 이용한 GPU Job 스케줄링vLLM 지표 기반 유휴 GPU 재활용으로 1.85억 원 비용 절감Infrastructureadvanced4 분 소요방금 전