Hacker NewsSchema 준수와 실제 값 정확도를 분리한 SOB 벤치마크로 LLM 결정론적 출력 검증Show HN: A new benchmark for testing LLMs for deterministic outputsAI/MLadvanced21 분 소요2026년 4월 29일