GeekNews£200로 데이터센터 GPU를 게이밍 PC에 넣기£200 투자로 VRAM 32GB 확보 및 LLM 32 tok/s 추론 달성AI/MLadvanced13 분 소요2026년 6월 1일
Dev.toCMP 100-210 Tensor Core 제약을 DP4A/HFMA2 우회로 해결한 Qwen3.5 추론 엔진I wrote a custom CUDA inference engine to run Qwen3.5-27B on $130 mining cardsAI/MLadvanced13 분 소요2026년 5월 3일