Dev.toMoE 기반 2T 파라미터 모델의 17B 수준 추론 효율 달성Llama 4: Meta's Latest — Scout, Maverick, and the MoE RevolutionAI/MLintermediate7 분 소요2026년 5월 25일
Dev.toContinuous Batching 기반 GPU 처리량 4배 향상 및 비동기 Job 아키텍처 설계Designing GenAI Infrastructure: How to Scale Video GenerationInfrastructureadvanced12 분 소요2026년 4월 12일