Dev.toPyTorch의 CUDA 메모리 캐싱 할당자가 53.7 MB를 해제하지 못하는 문제를 eBPF 추적으로 분석해 OS 스케줄링 간섭이 root cause임을 규명Tracing torch.cuda.empty_cache() on an RTX 4090 - Where Do the 53 MB Go?Backendadvanced6 분 소요2026년 3월 25일