피드로 돌아가기
Investigation Reports: When Monitors Get Smarter
Dev.toDev.to
DevOps

LLM 기반 자동 조사 리포트로 MTTR 단축 및 온콜 대응 효율화

Investigation Reports: When Monitors Get Smarter

Patrick Londa2026년 5월 22일4intermediate

Context

모니터링 알람 발생 시 담당 엔지니어의 도메인 지식 의존도가 높아 온콜 대응자의 MTTR이 증가하는 한계 존재. 기존 Playbook 방식의 문서화는 긴급 상황에서 가독성 및 실행력이 떨어지는 문제 발생.

Technical Solution

  • 시스템 이벤트 기반 Trigger를 통한 LLM의 비동기 조사 프로세스 설계
  • 정해진 Workflow 대신 LLM이 Bronto API를 직접 호출하는 Tool-use 방식 채택으로 유연성 확보
  • Context Rot 및 Hallucination 방지를 위해 전체 문서 주입 대신 사용자 정의 Investigation Prompt 구조 도입
  • 서비스 의존성, 로그 상관관계, 핵심 메트릭 등 도메인 특화 Context를 엔지니어가 직접 정의하여 LLM에 전달
  • 조사에 소요되는 시간적 여유(수 분 단위)를 활용해 다각도 데이터 쿼리 및 분석 결과의 구조적 리포트 생성

- LLM 도입 시 모든 컨텍스트를 주입하기보다 도메인 전문가가 정의한 핵심 가이드라인(Investigation Prompt)을 제공할 것 - 실시간 응답이 필요 없는 백그라운드 작업의 경우, LLM에게 더 많은 시간과 툴 사용 권한을 부여해 분석 정밀도를 높일 것 - 정형화된 Workflow 설계가 어려운 범용적 태스크는 Tool-use 기반의 자율적 에이전트 구조를 검토할 것

원문 읽기