전체 피드 소스 목록

카테고리

Frontend Backend DevOps AI/ML Mobile Database Security Career Infrastructure

© 2026 DevPick

#pre-training

피드 검색 북마크 설정

Hugging Face Blog

Token Sequence 길이 최적화로 Compute Cost 3배 절감

OlmoEarth v1.1: A more efficient family of models

AI/MLadvanced11 분 소요2026년 5월 19일

Dev.to

LLM 성능 고도화를 위한 Pre-Training 기반 Next Token Prediction 구조 분석

Understanding Reinforcement Learning with Human Feedback Part 1: Pre-Training Large Language Models

AI/MLbeginner4 분 소요2026년 5월 18일

Hacker News

WAN 환경에서 동기화 병목 제거로 학습 속도 20배 향상한 Decoupled DiLoCo

Decoupled DiLoCo: Resilient, Distributed AI Training at Scale

AI/MLadvanced4 분 소요2026년 4월 27일

Hugging Face Blog

Microsoft Research Asia가 단일 Transformer 인코더-디코더 아키텍처에 pre-net/post-net을 추가하여 음성-텍스트 변환(ASR, TTS), 음성-음성 변환을 하나의 모델으로 수행 가능하게 구현

Speech Synthesis, Recognition, and More With SpeechT5

AI/MLintermediate27 분 소요2023년 2월 8일

Hugging Face Blog

Hugging Face Transformers와 Habana Gaudi를 활용해 BERT 사전학습 비용을 $2,075 대비 $1,650으로 25% 절감

Pre-Train BERT with Hugging Face Transformers and Habana Gaudi

AI/MLintermediate27 분 소요2022년 8월 22일