Dev.toChannels-last 포맷 전환으로 A100 추론 지연 시간 22% 단축Channels-last memory format cut our conv backbone latency 22%AI/MLintermediate12 분 소요2026년 6월 24일