Hugging Face Blog연구팀이 LLM 기반 평가 메트릭(LAVE)을 도입해 Out-of-Distribution VQA 환경에서 의미론적으로 정확한 답변을 기존 문자열 매칭 메트릭보다 정확하게 평가LAVE: Zero-shot VQA Evaluation on Docmatix with LLMs - Do We Still Need Fine-Tuning?AI/MLintermediate18 분 소요2024년 7월 25일