Show GN: VLM은 한국 공공기관 문서를 얼마나 잘 읽을까? KOLongDoc 벤치마크 공개

한국어 공공문서 특화 Multi-page VLM 평가 벤치마크 KOLongDoc 공개

kyujin2026년 6월 4일1분intermediate

AI 요약

Context

기존 한국어 VLM 벤치마크의 OCR 및 단일 이미지 이해 중심 평가 체계로 인한 한계 발생. 수십 페이지 규모의 고해상도 문서 내 정보 연결 및 Long-context 이해 능력을 정밀하게 측정할 수 있는 검증 도구 부재.

실천 포인트

VLM 도입 시 단일 이미지 인식률 외에 Multi-page Context Window 처리 능력과 문서 내 정보 간의 연관 관계를 파악하는 Multi-hop 추론 성능을 반드시 검증할 것

태그