Dev.toJava AI 에이전트를 위한 네이티브 장기 기억 솔루션, Engram 분석The State of Memory in Java AI Agents (April 2026)AI/MLintermediate16 분 소요2시간 전
Dev.toLoCoMo 벤치마크 오류 6.4% 발견, LLM Judge의 신뢰성 한계 분석We audited LoCoMo: 6.4% of the answer key is wrong and the judge accepts up to 63% of intentionallyAI/MLadvanced14 분 소요3일 전