Hacker NewsKV cache 90% 절감 및 1M 토큰 컨텍스트 구현한 MoE 아키텍처DeepSeek-V4: Towards Highly Efficient Million-Token Context IntelligenceAI/MLadvanced16 분 소요4일 전