Dev.toExecution과 Judgment 분리 기반의 AI 추론 라우팅 최적화 전략Stop Turning On “Think Harder” For EverythingAI/MLintermediate7 분 소요2026년 4월 29일
Dev.toGroq Llama-3.3-70b 도입으로 400 tokens/sec의 초저지연 태그 추천 구현Using Groq llama-3.3-70b for Tag Suggestions — Low-Latency AI Routing PatternsAI/MLintermediate7 분 소요2026년 4월 19일