피드로 돌아가기
Dev.toDatabase
원문 읽기
pgbackrest에서 Barman으로의 전환 및 컨테이너 환경의 운영 복잡도 분석
Barman reemplaza a pgbackrest: migré mis backups de Postgres en producción y esto encontré
AI 요약
Context
pgbackrest의 유지보수 중단으로 인한 대안 탐색 및 데이터 복구 신뢰성 확보 필요성 대두. 기존 Railway 기반 PostgreSQL 16 컨테이너 환경에서 18분의 Restore Time을 유지하며 마이그레이션 시도.
Technical Solution
- SSH 접근이 제한된 컨테이너 환경 극복을 위해 backup_method를 streaming으로 설정한 아키텍처 설계
- 데이터 정합성 및 스트리밍 복제를 위해 Superuser와 Replication 권한을 가진 두 개의 전용 계정 분리 생성
- pg_hba.conf 설정을 통한 Barman 서버 IP 기반의 세밀한 접속 제어 및 보안 강화
- 복구 윈도우 확보를 위해 14일 유지 정책(Retention Policy)을 적용한 스냅샷 관리
- Replication Slot 모니터링을 통한 WAL 파일 누적으로 인한 디스크 풀(Full) 장애 방지 설계
- 외부 Scheduler(Cron)를 도입하여 Barman의 자동 재시도 부재 문제를 보완하는 운영 구조 구축
실천 포인트
1. Container 환경 도입 시 SSH 기반 백업 도구의 제약 사항 및 Streaming 방식의 오버헤드 검토
2. Replication Slot의 상태를 실시간 모니터링하여 저장 공간 고갈 리스크 제거
3. 벤더 제공 백업 솔루션의 SLA와 자체 구축 솔루션의 운영 비용 및 Restore Time 비교 분석
4. 마이그레이션 완료 전 실제 데이터 기반의 Restore 테스트 및 소요 시간 측정 필수