Dev.toLLM-as-judge Binary 전환을 통한 Cohen's Kappa 0.47에서 0.78로 개선Switching our LLM-as-judge from 5-class to binary in CI: the patterns we keptAI/MLadvanced7 분 소요6시간 전