피드로 돌아가기
Read-Write MCP: Three Cloud Operations We Stopped Letting AI Touch After 90 Days
Dev.toDev.to
Infrastructure

Global Context 결여 해결을 위한 Capability-Tier 기반 AI 권한 제어 설계

Read-Write MCP: Three Cloud Operations We Stopped Letting AI Touch After 90 Days

Muskan2026년 5월 15일11advanced

Context

AI Agent의 Cloud Operation 자동화를 위해 Read-Write MCP를 도입했으나, 로컬 데이터만으로는 판단 불가한 Global Context 부재로 인해 장애 발생. 특히 의존성 전파(Dependency Cascade)와 복구 비용(Recovery Cost) 등의 전역적 제약 사항을 LLM이 인지하지 못해 시스템 가용성에 치명적인 영향을 미침.

Technical Solution

  • Action의 위험도와 가역성에 따른 Capability-Tier 모델 도입을 통한 권한 차등 부여
  • Tier 1(Low blast radius, High reversibility)에 한해서만 Write-enabled 권한을 부여하고 고위험 작업은 Read-and-propose 구조로 전환
  • 단일 계정 내 Local Data 기반 판단의 한계를 극복하기 위해 Resource-touch Graph를 통한 의존성 가시성 확보 시도
  • Graph Completeness Confidence 점수를 Trust Score에 반영하여 AI의 판단 신뢰도를 정량적으로 검증
  • API 수준의 우회를 방지하기 위해 MCP Tool 레이어에서 Capability-tier 필드를 통한 구조적 정책 강제 적용

- AI에게 Write 권한 부여 전 Action의 가역성(Reversibility)과 영향 범위(Blast Radius)를 정의했는가? - Local Context(API 응답값) 외에 Global Context(Cross-account, Cross-region)가 판단에 필요한 요소인가? - 고위험 작업에 대해 '자동 실행'이 아닌 '제안 후 승인(Read-and-propose)' 프로세스가 설계되었는가? - 의존성 그래프(Dependency Graph)를 통해 AI가 참조한 리소스의 완전성을 검증하는 메커니즘이 존재하는가?

원문 읽기