Dev.toAI 메모리 평가의 신뢰성 확보를 위한 10대 설계 원칙과 2,400개 문제 벤치마크 제안Proposal: A Real Benchmark for Long-Term AI Memory SystemsAI/MLadvanced9 분 소요2026년 4월 10일