GeekNewsCS336: 처음부터 만드는 언어 모델링Triton 기반 FlashAttention2 및 분산 학습으로 LLM Full-stack 구현AI/MLadvanced14 분 소요2026년 6월 2일
Hacker NewsFrom Scratch 기반 LLM 풀스택 설계 및 GPU 최적화 구현CS336: Language Modeling from ScratchAI/MLadvanced12 분 소요2026년 6월 1일