피드로 돌아가기
I Made 4 LLMs Argue With Each Other to Write Better Runbooks. Here's What Happened.
Dev.toDev.to
AI/ML

Multi-LLM Cross-Review 구조를 통한 Runbook 신뢰성 극대화

I Made 4 LLMs Argue With Each Other to Write Better Runbooks. Here's What Happened.

Jaime Moreno2026년 5월 18일6intermediate

Context

단일 LLM 기반 Runbook 생성 시 발생하는 Silent Failure와 Hallucination 문제 분석. 특히 Rollback 단계 누락이나 잘못된 CLI Flag 생성 등 기술 문서의 치명적 결함 해결 필요성 대두.

Technical Solution

  • AI Council 아키텍처 도입을 통한 4개 독립 모델의 초안 생성 및 상호 검토 구조 설계
  • 생성(Generation)과 검토(Critique)의 최적화 목표 분리를 통한 오류 탐지율 향상
  • 12개의 상호 리뷰 데이터를 기반으로 '비판을 견뎌낸 단계'만 채택하는 Chairman 모델의 합의 알고리즘 적용
  • 불확실한 정보에 대해 강제 합의 대신 Warning으로 노출하는 Conservative Synthesis 전략 채택
  • 모델 다양성 확보를 위해 서로 다른 Prior를 가진 모델 조합으로 Failure Mode 다각화
  • 단순 결과 취합이 아닌 구조적 비판(Line number 기반) 프로세스를 통한 정밀도 제고

["\uc624\ub958 \ube44\uc6a9\uc774 \ub192\uc740 \ub3c4\uba54\uc778(\ubc95\ub960, \uc758\ub8cc, \uc778\ud504\ub77c) \uc124\uacc4 \uc2dc Cross-Review \ud328\ud134 \uac80\ud1a0", "\uc0c1\ud638 \uac80\ud1a0 \uc2dc '\uad6c\uc870\uc801 \ube44\ud310(\ud2b9\uc815 \ud56d\ubaa9 \ub204\ub77d, \uc798\ubabb\ub41c \ud50c\ub798\uadf8 \ub4f1)'\uc744 \uac15\uc81c\ud558\ub294 \ud504\ub86c\ud504\ud2b8 \uc124\uacc4", "\ud569\uc758 \ubd88\uac00\ub2a5\ud55c \uc9c0\uc810\uc740 \uac15\uc81c \uacb0\uc815\ubcf4\ub2e4 \uc0ac\uc6a9\uc790\uc5d0\uac8c Warning\uc73c\ub85c \ub178\ucd9c\ud558\ub294 UX \uc124\uacc4 \uc801\uc6a9", "\ubaa8\ub378 \uac1c\uc218 \uc99d\uac00\uc5d0 \ub530\ub978 \ud55c\uacc4 \ud6a8\uc6a9 \uc9c0\uc810(\ubcf8 \uc0ac\ub840 \uae30\uc900 4\uac1c)\uc744 \ud30c\uc545\ud558\uc5ec \ube44\uc6a9-\ud6a8\uc728 \ucd5c\uc801\ud654"]

원문 읽기