Dev.toLLM 코딩 벤치마크 수치보다 Project Context 일관성이 설계 품질 결정Kimi K2.6 vs Claude vs GPT-5.5: lo puse contra mis casos reales de coding y los números me sorprendieronAI/MLintermediate29 분 소요2026년 5월 3일