Dev.toAI 인프라 비용의 HBM 쏠림과 Prefix Cache 최적화 기반 비용 절감 전략GeekNews AI Weekly Deep Dive - 2026-06-22AI/MLintermediate3 분 소요2026년 6월 22일