피드로 돌아가기
Introducing hwp-mcp: Korean document support for Claude via MCP
Dev.toDev.to
AI/ML

MCP 기반 hwp-mcp 도입을 통한 한국어 문서 처리 병목 해결

Introducing hwp-mcp: Korean document support for Claude via MCP

TreeSoop2026년 4월 17일1intermediate

Context

정부 및 기업 워크플로우 내 HWP/HWPX 문서의 높은 비중으로 인한 LLM 데이터 인입 제약 발생. 기존 Hancom API의 유료 라이선스 및 Windows 종속성으로 인한 확장성 한계 직면.

Technical Solution

  • Model Context Protocol(MCP) 표준 채택을 통한 LLM-외부 데이터 간 인터페이스 단일화
  • Hancom Office 라이선스 없이 작동하는 독립적 파싱 로직 구현으로 OS 범용성 확보
  • 단순 텍스트 추출을 넘어 Table 구조화 및 Embedded Image 추출 기능 제공으로 컨텍스트 손실 방지
  • Template Variable 치환 기능을 통한 문서 자동 생성 파이프라인 구축
  • uvx 기반의 원라인 설치 구조 설계를 통한 개발자 온보딩 비용 최소화

1. RAG 시스템 구축 시 도메인 특화 문서 포맷의 파싱 가능 여부 확인

2. 특정 OS나 유료 라이선스 종속성이 없는 오픈소스 파서 검토

3. MCP 표준 적용을 통해 다양한 LLM 클라이언트(Claude, Cursor 등)와의 호환성 확보

원문 읽기