PLE 도입으로 2B 모델의 추론 성능을 7B 수준으로 끌어올린 Gemma 4 E2B
How Gemma 4's Per-Layer Embeddings Actually Work — And Why E2B Punches Above 2B
How Gemma 4's Per-Layer Embeddings Actually Work — And Why E2B Punches Above 2B
Shared expert pool reduces parameters while maintaining performance
Pattern Is All You Need: Why NPC Depth Beats Model Size
Why not Lannguage Specific SLMs as coding agents
활성 파라미터 3% 제어로 구현한 1.6조 규모 MoE의 비용 혁신
1.6T 파라미터 규모의 DeepSeek-V4-Pro 및 Flash 모델 출시
Vision Language Models (Better, faster, stronger)
SmolVLM Grows Smaller – Introducing the 256M & 500M Models!