Hugging Face BlogBAAI가 FlagEval-Debate 플랫폼으로 LLM 평가에 다중언어 토론 방식을 도입해 기존 정적 평가의 편향성 제거Letting Large Models Debate: The First Multilingual LLM Debate CompetitionAI/MLintermediate27 분 소요2024년 11월 20일