MCP Authoring-Execution 분리를 통한 토큰 비용 0원 달성

MCP is the authoring layer. Execution should cost zero tokens.

Leon2026년 4월 22일4분intermediate

AI 요약

Context

MCP의 Schema Injection으로 인한 30~40%의 추가 Token Overhead 발생 및 컨텍스트 윈도우 낭비 문제 직면. 특히 Browser Automation 시 매 호출마다 발생하는 거대 JSON Schema 및 상태 정보 전송으로 인한 비용 효율성 저하 분석.

Technical Solution

MCP를 Discovery 중심의 Authoring Layer로, CLI를 Deterministic한 Execution Layer로 분리한 Two-Layer Model 설계
AI가 사이트 분석 및 코드 구조를 정의하는 Forge 단계에서만 MCP를 사용하여 .tap.js 파일을 생성하는 일회성 비용 구조 채택
실행 단계인 tap.run에서는 AI 개입 없이 생성된 JS 파일을 직접 호출하여 Token 소모를 원천 차단하는 구조 구현
40개의 Tool 중 12개의 Core Tool만 초기 로드하고 나머지는 Demand-based로 로드하는 Deferred Tool Loading 기법 적용
MCP Server와 CLI가 동일한 Binary를 공유하여 내부 함수 호출의 일관성을 유지하는 통합 인터페이스 설계

실천 포인트

- AI Tool 정의 시 모든 Schema를 초기 컨텍스트에 주입하는 대신 Deferred Loading 전략 검토 - 반복 실행되는 워크플로우의 경우 'AI Prompting' 대신 'AI-generated Code' 실행 방식으로 전환 - Discovery 단계(비용 발생)와 Execution 단계(비용 제로)의 인터페이스를 엄격히 분리

태그

#MCP #Browser-Automation #Token Overhead #Deferred Loading #Architecture Design

원문 읽기