피드로 돌아가기
InfoQInfoQ
AI/ML

LangGraph 기반 Multi-Agent 시스템으로 매월 수백 시간의 엔지니어링 리소스 확보

Designing a Multi-Agent System for Engineering Support at Scale: A Case Study From Grab

Leela Kumili2026년 5월 20일3advanced

Context

1,000명 이상의 내부 사용자와 15,000개 이상의 테이블을 관리하는 대규모 ADW 플랫폼의 운영 부하 가중. 단순 반복적인 SQL 디버깅 및 로그 분석 작업으로 인해 플랫폼 고도화를 위한 엔지니어링 밴드위스 부족 현상 발생.

Technical Solution

  • LangGraph 기반의 Workflow Engine과 FastAPI를 결합한 상태 관리 및 라우팅 구조 설계
  • Investigation(진단)과 Enhancement(개선) 워크플로우를 분리하여 에이전트의 추론 복잡도 감소 및 신뢰성 확보
  • Supervisor 패턴 도입을 통한 에이전트 간 통신 제어 및 효율적인 태스크 위임 체계 구축
  • 30여 개의 방대한 내부 툴셋을 큐레이션된 핵심 툴셋으로 축소하여 에이전트의 도구 선택 예측 가능성 향상
  • Token 제한 극복을 위한 구조적 Context Compression 및 선택적 Retrieval 전략 적용
  • Human-in-the-loop 검증 단계 삽입으로 자동 생성된 코드의 안정성과 거버넌스 확보

1. 에이전트의 도구(Tool) 개수를 최소화하여 선택 정확도를 높였는가?

2. 쓰기 작업(Code Change) 시 Human-in-the-loop 검증 프로세스가 설계되었는가?

3. 상태 유지(State Management)를 위한 컨텍스트 압축 전략이 포함되었는가?

4. 단순 챗봇 형태가 아닌 목적별 워크플로우 분리 구조를 채택했는가?

원문 읽기