피드로 돌아가기
Rebooting a Production VM on Oracle Cloud: A Reference Guide
Dev.toDev.to
Infrastructure

OCI 컴퓨트 인스턴스의 Ubuntu VM에서 Docker Compose 기반 서비스를 안정적으로 재부팅하기 위한 검증된 절차와 실제 명령어 출력을 제공하는 실습 가이드

Rebooting a Production VM on Oracle Cloud: A Reference Guide

Smyekh David-West2026년 3월 30일12intermediate

Context

OCI 컴퓨트 인스턴스에서 Ubuntu 22.04를 실행 중인 VM의 재부팅은 SSH 세션이 갑자기 중단되는 특성상 엔지니어에게 불확실성을 유발한다. 많은 경우 재부팅 전후의 시스템 상태를 확인하는 구체적 절차가 부재하여 재부팅 후 컨테이너 미실행이나 서비스 중단 문제가 발생한다.

Technical Solution

  • Docker Compose 서비스의 restart: always 정책을 설정하여 시스템 재부팅 후 컨테이너 자동 복구 보장
  • docker ps 명령어로 모든 컨테이너의 상태 및 경과 시간을 확인하고 비정상 상태(재시작 루프, 헬스체크 실패) 선제적 감지
  • docker compose config 명령어로 환경 변수 전개 및 YAML 문법 유효성 검증하여 재부팅 후 컨테이너 시작 실패 사전 방지
  • apt upgrade 출력에서 커널, 네트워킹 스택, 컨테이너 런타임 관련 패키지를 식별하고 재부팅 필요성 판단
  • systemd-analyze blame 명령어로 OS 부팅 시간 및 서비스별 부팅 소요 시간 분해 측정

Impact

재부팅 후 서비스 복구 시간을 TTR(Time To Recovery) 지표로 정량 측정 가능

Key Takeaway

재부팅은 직감이 아닌 검증된 절차로 수행해야 하며, pre-flight 체크리스트 완료와 함께 복구 시간 목표를 명확히 수립하는 것이 운영 환경의 안정성을 확보하는 핵심이다


OCI Ubuntu 22.04 인스턴스에서 Docker Compose 기반 서비스를 운영하는 환경에서 재부팅 전 docker ps 상태 확인과 docker compose config 검증 절차를 사전에 실행하면 재부팅 후 컨테이너 자동 복구율을 높일 수 있다

원문 읽기