Show GN: Garu: 브라우저에서 돌아가는 1.7MB 한국어 형태소 분석기 (F1 95.3%, WASM)

개발자가 코드북과 Viterbi 알고리즘으로 신경망 없이 브라우저에서 실행되는 1.7MB 한국어 형태소 분석기를 구현하여 95.3%의 정확도를 달성했다

dydwls1402026년 3월 30일1분intermediate

AI 요약

Context

기존 Kiwi, MeCab-ko 형태소 분석기는 서버 환경에 최적화되어 있어서 크기가 40~50MB에 달한다. 클라이언트 사이드에서 경량 형태소 분석이 필요한 경우 선택지가 없었다.

모델 크기가 기존 대비 약 96% 감소했다(50MB → 1.7MB). 정확도는 Kiwi 87.9%, MeCab-ko 85% 대비 95.3%로 향상되었다.

신경망이 아닌 전통적인 알고리즘으로도 특정 태스크에서 경쟁력 있는 성능을 달성할 수 있다.

실천 포인트

브라우저 환경에서 한국어 텍스트를 처리할 때 코드북과 Viterbi 기반의 비신경망 아키텍처를 적용하면 서버 의존 없이 1.7MB 미만의 가벼운 형태소 분석기를 구현할 수 있다

태그