피드로 돌아가기
Dev.toAI/ML
원문 읽기
MCP Authoring-Execution 분리를 통한 토큰 비용 0원 달성
MCP is the authoring layer. Execution should cost zero tokens.
AI 요약
Context
MCP의 Schema Injection으로 인한 30~40%의 추가 Token Overhead 발생 및 컨텍스트 윈도우 낭비 문제 직면. 특히 Browser Automation 시 매 호출마다 발생하는 거대 JSON Schema 및 상태 정보 전송으로 인한 비용 효율성 저하 분석.
Technical Solution
- MCP를 Discovery 중심의 Authoring Layer로, CLI를 Deterministic한 Execution Layer로 분리한 Two-Layer Model 설계
- AI가 사이트 분석 및 코드 구조를 정의하는 Forge 단계에서만 MCP를 사용하여 .tap.js 파일을 생성하는 일회성 비용 구조 채택
- 실행 단계인 tap.run에서는 AI 개입 없이 생성된 JS 파일을 직접 호출하여 Token 소모를 원천 차단하는 구조 구현
- 40개의 Tool 중 12개의 Core Tool만 초기 로드하고 나머지는 Demand-based로 로드하는 Deferred Tool Loading 기법 적용
- MCP Server와 CLI가 동일한 Binary를 공유하여 내부 함수 호출의 일관성을 유지하는 통합 인터페이스 설계
실천 포인트
- AI Tool 정의 시 모든 Schema를 초기 컨텍스트에 주입하는 대신 Deferred Loading 전략 검토 - 반복 실행되는 워크플로우의 경우 'AI Prompting' 대신 'AI-generated Code' 실행 방식으로 전환 - Discovery 단계(비용 발생)와 Execution 단계(비용 제로)의 인터페이스를 엄격히 분리