피드로 돌아가기
I asked Claude how it wants to browse the web. It wrote 19K lines of Rust, then asked 3 other AIs to review them.
Dev.toDev.to
AI/ML

Multi-Agent Review 기반 LAD 설계로 토큰 비용 60배 절감

I asked Claude how it wants to browse the web. It wrote 19K lines of Rust, then asked 3 other AIs to review them.

Tiago2026년 4월 15일2advanced

Context

기존 Playwright 기반 브라우저 자동화의 과도한 토큰 소비와 LLM의 Web Navigation 효율 저하 문제 발생. Agent 관점의 DX(Developer Experience) 부재로 인한 도구 호출 비효율성 및 런타임 예외 처리 미흡함이 병목 지점으로 작용.

Technical Solution

  • Semantic View 도입을 통한 페이지 데이터 압축 및 전송 토큰 최적화 구조 설계
  • Agent-as-Consumer 관점의 DX 리뷰를 통한 Tool-set 확장 및 Batch Action 도구(lad_fill_form) 구현
  • Rust 기반 고성능 MCP server 구축으로 메모리 안전성 확보 및 실행 속도 최적화
  • Multi-Agent Adversarial Review Loop를 통한 iOS Retain Cycle 및 NDJSON Framing Bug 사전 제거
  • Chaos Engineering 관점의 Edge Case(Shadow DOM Recursion, OOM 등) 분석을 통한 시스템 견고성 강화
  • Remote Control 프로토콜 적용을 통한 실물 iPhone Safari 제어 인터페이스 구현

Impact

  • 페이지 토큰 소모량 약 18K tokens에서 300 tokens로 감소
  • Roundtrip 비용 약 60배 절감 달성
  • Multi-Agent 리뷰를 통한 30개 이상의 기술적 결함 수정 및 0건의 미해결 이슈 도달

- LLM 기반 도구 설계 시 호출 주체(Agent)의 관점에서 API 이름과 에러 메시지를 설계했는지 검토 - 복잡한 로직 구현 후 서로 다른 특성을 가진 여러 LLM 모델을 활용한 교차 검증(Adversarial Review) 프로세스 도입 - 무한 루프, 거대 페이로드, 재귀 호출 등 극한의 Edge Case를 정의한 Chaos Testing 시나리오 적용

원문 읽기