피드로 돌아가기
I stopped trusting Claude's code reviews, so I built a skill that puts my code on trial
Dev.toDev.to
AI/ML

Adversarial Multi-Agent 설계를 통한 LLM Code Review 신뢰도 확보

I stopped trusting Claude's code reviews, so I built a skill that puts my code on trial

hekman3162026년 6월 13일2intermediate

Context

단일 LLM 모델의 성향상 발생하는 Agreeableness(동의 편향)로 인해 코드 리뷰의 정확도 저하 및 모호한 피드백 발생. 단순한 '비판적 요청'만으로는 해결 불가능한 모델 내부의 긍정 편향을 극복하기 위한 구조적 접근 필요.

Technical Solution

  • Adversarial Roles 기반의 다단계 검증 파이프라인 설계를 통한 객관적 신호 추출
  • Hater Agent를 통한 개별 파일 단위의 강제적 결함 탐색 및 Correctness, Race Condition, Leak 등 기술적 엣지 케이스 집중 분석
  • Integration Agent를 통한 파일 간 의존성 및 함수 시그니처 불일치 등 Cross-module 버그 탐지
  • Judge Agent의 증거 기반 검토를 통한 Hater의 공격 내용에 대한 정당성 및 실제 결함 여부 판별
  • Verdict 단계에서 Judge가 방어하지 못한 약점만을 필터링하여 최종 리포트 생성
  • 외부 런타임 없이 Claude sub-agents(Agent tool)만으로 구현한 Portable 아키텍처 채택

1. LLM의 편향성을 제거하기 위해 단일 프롬프트가 아닌 대립하는 역할을 가진 Multi-Agent 구조 검토

2. '비판'과 '방어'라는 상충하는 목표를 부여하여 결과물의 신뢰도(Signal-to-Noise Ratio) 향상

3. 전체 맥락 분석 전 세부 요소(File-level) 분석을 선행하는 단계적 파이프라인 설계

원문 읽기