Hacker News10M 파라미터 GPT 모델을 노트북 환경에서 1시간 내 구현Train Your Own LLM from ScratchAI/MLintermediate9 분 소요2026년 5월 5일
Dev.toKV Caching과 MMHA 구조를 통한 Decoder-only LLM 추론 최적화LLM Study Diary #1: TransformerAI/MLintermediate10 분 소요2026년 5월 1일