피드로 돌아가기
Dev.toInfrastructure
원문 읽기
Cloud Run Primitives 도입을 통한 Agentic Compute Fabric으로의 진화
The Most Underrated Infrastructure Shift of the Year: Google Cloud’s New Serverless
AI 요약
Context
기존 Stateless 기반 Serverless 모델은 장시간 실행되는 AI Agent의 상태 유지 및 동적 코드 실행 보안 요구사항을 충족하지 못한 한계 노출. 특히 Local Filesystem의 tmpfs 구조로 인한 RAM 오버프로비저닝 및 OOM 발생이 아키텍처적 병목 지점으로 작용.
Technical Solution
- Cloud Run Instances 도입을 통한 Scale-to-zero 제약 제거 및 지속적 Background Processing 환경 구축
- gVisor 기반의 Cloud Run Sandboxes 적용으로 Untrusted Code 실행 시 Syscall 및 Egress 제한을 통한 Zero-trust 격리 환경 구현
- Ephemeral Disk(NVMe block storage) 제공을 통한 RAM 기반 임시 저장소 의존성 탈피 및 메모리 효율성 최적화
- Model Context Protocol(MCP) 네이티브 통합을 통한 Gemini Enterprise Agent Platform과의 IAM 인증 기반 오케스트레이션 달성
- Stateful Serverless 추상화를 통한 GKE/VM 전환 없이도 지속적 상태 유지가 가능한 Compute Fabric 설계
실천 포인트
1. AI Agent의 Local Scratch Space 필요 시 RAM 증설 대신 Ephemeral Disk 적용 검토
2. 동적 코드 생성 및 실행 워크로드에 대해 gVisor 기반 Sandbox 격리 수준 설정
3. 지속적 Event Backbone 구축 시 HTTP Concurrency 해킹 대신 Cloud Run Instances 활용
4. LLM Tool Calling의 보안 위협 제거를 위해 Granular Syscall Restriction 정책 수립