피드로 돌아가기
Dev.toAI/ML
원문 읽기
MCP 기반 브라우저 자동화 도입으로 지연시간 25배 개선 및 비용 최적화
MCP vs CLI for Browser Automation: I Benchmarked Both and the Results Surprised Me
AI 요약
Context
기존 CLI 기반 브라우저 자동화는 매 요청마다 Subprocess를 생성하는 구조적 한계로 인해 높은 오버헤드 발생. Agent 기반 워크플로우에서 빈번한 API 호출 시 누적 지연시간과 도구 정의(Tool Definition)로 인한 Token 낭비가 병목 지점으로 작용.
Technical Solution
- Persistent stdio connection을 활용한 MCP Direct 경로 설계로 세션 유지 및 핸드쉐이크 비용 제거
- Zod Parser 기반의 Schema-driven CLI Generator를 구축하여 84개 도구의 정의를 자동 동기화하는 구조 채택
- Subprocess 생성 단계를 배제하고 Python에서 직접 safari-mcp 서버로 요청을 전달하는 저지연 경로 확보
- Runtime Click Generator를 통한 도구 매핑 자동화로 수동 유지보수 비용 제거 및 스키마 일관성 유지
- Token 비용 절감을 위해 CLI 인터페이스의 간소화된 도구 정의 방식을 병행 운용하는 하이브리드 접근법 적용
실천 포인트
- 실시간 반응성이 중요한 Agent 인터페이스 설계 시 Subprocess 기반 호출 대신 Persistent Connection 고려 - 반복적인 API 정의 작업 시 Zod 등 스키마 라이브러리를 활용한 자동 생성 파이프라인 구축 - LLM 기반 도구 호출 설계 시 Latency뿐만 아니라 Tool Definition에 소모되는 Token 비용을 핵심 지표로 설정