GeekNewsAI 에이전트 스킬, 벤치마크 성능의 절반도 현실에서 안 나온다현실적 스킬 검색 한계로 인한 AI 에이전트 성능 급락 및 Recall@5 65.5% 달성AI/MLintermediate2 분 소요1일 전
Dev.toRAG 인프라 기반 AI Memory의 벤치마크 왜곡 및 설계 결함 분석The YC President Endorsed an AI Memory System With Fake Benchmarks. He Also Shipped His Own. We Read the Code.AI/MLintermediate6 분 소요6일 전