Dev.toBPE 도입을 통한 UNK 토큰 제거 및 시퀀스 효율성 최적화LLM Study Diary #2: TokenizationAI/MLbeginner5 분 소요2026년 5월 4일
Dev.toFully Connected Layer와 Softmax를 통한 Transformer 출력 토큰 결정 구조Understanding Transformers Part 17: Generating the Output WordAI/MLbeginner3 분 소요2026년 5월 1일