피드로 돌아가기
How We Cut Browser Agent Costs 7,000x with Collective Intelligence
Dev.toDev.to
Backend

Arcede가 에이전트 간 공유 능력 그래프(AIR SDK)로 브라우저 자동화 LLM 비용을 7,000배 감소

How We Cut Browser Agent Costs 7,000x with Collective Intelligence

Arcede2026년 3월 28일3intermediate

Context

모든 브라우저 에이전트는 매 단계마다 전체 DOM을 LLM에 입력해 "무엇을 클릭할까"를 반복 질문하는 비효율적 패턴을 사용하고 있다. 10단계 워크플로우는 약 $4의 LLM 토큰 비용과 약 50초의 추론 시간이 소요되며, 에이전트 A가 특정 웹사이트의 검색 기능을 학습해도 세션이 종료되면 그 지식은 사라져 에이전트 B와 C가 처음부터 재학습해야 한다.

Technical Solution

  • 공유 능력 그래프 구축: AIR SDK라는 오픈소스 MCP 서버를 개발해 모든 연결된 에이전트 간 기능 정보를 지속적으로 유지 및 공유
  • 3가지 핵심 API 제공: browse_capabilities(domain)으로 특정 도메인에서 수행 가능한 액션 조회, execute_capability(action, params)로 CSS 선택자·API 경로·매크로 제공, report_outcome(steps, success)로 작동한 선택자 정보를 전체 에이전트에 피드백
  • 4단계 계층형 능력 해석: API fast-path(알려진 API 엔드포인트 우선), Verified macro(이전 에이전트 보고서 기반 검증된 CSS 선택자), Selector hints(부분 지식으로 LLM 추론 비용 감소), Heuristic plan(미탐색 사이트용 최선의 추측)
  • agent.json 표준 정립: robots.txt과 유사한 형태로 웹사이트가 AI 에이전트를 위한 사용 가능한 액션을 선언하는 표준 정의, 2,225개 도메인 사전 색인화
  • 자동 학습 메커니즘: 에이전트 보고서를 통해 자동으로 기능을 학습하거나 웹사이트가 /.well-known/agent.json에서 자신의 정보를 직접 게시 가능

Impact

  • 단일 액션(클릭 검색) 비용: $0.24에서 $0.0006으로 400배 감소
  • 10단계 워크플로우 비용: $4.13에서 $0.0006으로 7,000배 감소
  • 액션당 처리 시간: ~5초에서 <100ms으로 50배 단축

Key Takeaway

분산된 에이전트들이 개별적으로 중복 학습하는 문제는 공유 메타데이터 계층(능력 그래프)과 표준화된 선언 형식(agent.json)으로 단계적으로 해결할 수 있으며, 이는 전체 시스템의 비용과 처리 시간을 기하급수적으로 절감시킨다.


브라우저 자동화나 웹 스크래핑을 수행하는 엔지니어 팀에서 AIR SDK를 도입하면, 에이전트 실행 비용을 감소시킬 뿐만 아니라 이전에 발견된 CSS 선택자와 API 경로를 캐시 계층으로 활용해 새로운 작업 수행 시간과 LLM 추론 비용을 동시에 줄일 수 있다.

원문 읽기
How We Cut Browser Agent Costs 7,000x with Collective Intelligence | Devpick