WebSearch 분리를 통한 LLM 파이프라인 런타임 85% 단축 및 비용 63% 절감

I Gave My Strategist Agent WebSearch. 5 Topics Took 20 Minutes. Splitting It Into 3 Roles Made It 3.

Ken Imoto2026년 5월 18일8분intermediate

AI 요약

Context

단일 Agent가 데이터 수집, 전략 수립, 콘텐츠 작성을 모두 수행하는 God-Object 구조 채택. WebSearch 결과가 Judgment Context에 누적됨에 따라 Signal-to-Noise Ratio가 저하되고 실행 시간이 20분까지 증가하는 병목 발생.

Technical Solution

Observer/Strategist/Marketer 3개 역할로 책임을 분리한 Pipeline 아키텍처 설계
Observer: API 기반 데이터 스냅샷 생성에 집중하여 외부 간섭을 배제한 순수 데이터 수집 단계 구축
Strategist: WebSearch 권한을 물리적으로 제거하여 외부 트렌드 노이즈를 차단하고 내부 데이터 기반의 의사결정 로직 구현
Marketer: 최종 실행 단계에서만 WebSearch를 허용하여 판단이 아닌 단순 사실 확인 및 인용 작업으로 활용 범위를 제한
역할별 Allow-list 기반 도구 제어를 통해 Agent의 임의적인 도구 사용 가능성을 원천 차단
단일 컨텍스트 공유 방식에서 단계별 결과물 전달 방식으로 전환하여 Context Pollution 해결

Impact

실행 시간: 20분에서 3분으로 약 85% 단축
토큰 소모량: 일일 약 120k에서 45k로 62% 감소
API 비용: 월 $60에서 $22로 63% 절감
디버깅 시간: 장애 발생 시 평균 30~60분에서 5~10분으로 80% 단축

Key Takeaway

Judgment Loop 내의 외부 데이터 검색(WebSearch)은 컨텍스트 오염과 런타임 지연을 초래하는 안티 패턴임. AI Agent 설계 시 '판단'과 '실행'의 단계를 엄격히 분리하고, 각 단계에 필요한 최소 권한(Principle of Least Privilege)만 부여하는 것이 시스템 안정성과 효율성의 핵심임.

실천 포인트

- LLM 파이프라인 설계 시 '판단' 단계에서 외부 검색 도구를 제거하고 내부 데이터 기반으로 의사결정하는지 검토 - God-Agent 구조를 기능별 단일 책임 Agent들로 분리하여 각 단계의 입출력을 정형화(JSON 등)했는지 확인 - Agent별로 사용 가능한 도구 목록(Allow-list)을 물리적으로 제한하여 프롬프트 드리프트 방지 - 전체 실행 시간과 토큰 비용의 병목이 특정 도구(Search, Fetch 등)의 반복 호출에서 발생하는지 측정

태그

#Separation of Concerns #Token Optimization #LLM Pipeline #Agentic Workflow #Context Pollution

원문 읽기