Needle - Gemini 도구 호출을 증류한 2600만 파라미터 모델
Gemini 증류 기반 26M 파라미터의 초경량 Tool Use 모델 Needle 분석
Gemini 증류 기반 26M 파라미터의 초경량 Tool Use 모델 Needle 분석
Learning in 2026 with AI - How I Prepared for and Passed KCNA
RVQ 양자화 갭 분석을 통한 AI 음악 탐지 F1 0.983 달성
Model Compression Techniques for Edge Deployment
On-Device AI Agents vs Cloud AI Agents: Which Path Are You Betting On?
카카오톡이 지식 증류 기법으로 영어 전용 텍스트 인코더를 다국어(5개 언어)로 확장해 Recall@5 78% 달성하며 온디바이스 이미지 검색 구현
컬리가 RQ-VAE 기반 Semantic ID와 Transformer 기반 Dual-Head Architecture를 결합해 개인화 추천 시스템을 구축하고 CRM 캠페인 클릭률 55.6% 향상 달성
Apriel-H1: The Surprising Key to Distilling Efficient Reasoning Models
Measuring Open-Source Llama Nemotron Models on DeepResearch Bench
Welcome to the Falcon 3 Family of Open Models!
Welcome Gemma 2 - Google’s new open LLM
Open-sourcing Knowledge Distillation Code and Weights of SD-Small and SD-Tiny