MySQL InnoDB ClusterSet 기반 무중단 DR 체계 구축 및 RPO 수 초대 단축

Setting Up Disaster Recovery for Morpheus Enterprise with MySQL InnoDB ClusterSet — Step by Step

Emre Baykal2026년 4월 20일26분advanced

AI 요약

Context

단일 데이터 센터 내 고가용성을 제공하는 InnoDB Cluster의 사이트 전체 장애 대응 한계 노출. 리전 단위 장애 발생 시 서비스 가용성 상실 문제를 해결하기 위한 멀티 사이트 재해 복구(DR) 체계 필요성 증대.

Technical Solution

Primary Cluster와 Replica Cluster를 Async Replication으로 연결하는 InnoDB ClusterSet 구조 설계
MySQL Router의 토폴로지 자동 인식 기능을 통한 애플리케이션 Connection String 변경 없는 Failover 구현
데이터 일관성 확보를 위해 Character set, Timezone, SQL mode 등 서버 레벨 설정의 정밀한 동기화 수행
TLS 암호화 및 scoped replicationAllowedHost 설정을 통한 사이트 간 복제 채널 보안 강화
recoveryMethod: 'clone' 플러그인 활용으로 초기 데이터 동기화 및 복구 프로세스 효율화
errant GTID 정리 및 Old-Master Fencing 절차 수립을 통한 비정상 Failover 상황의 데이터 무결성 보장

실천 포인트

- 사이트 간 RTT 50ms 초과 시 Write-heavy 워크로드의 GTID 적용 처리량 저하 여부 벤치마크 수행 - binlog_expire_logs_seconds 설정을 최소 7일 이상으로 유지하여 수동 복구 가능 시간 확보 - ClusterAdmin과 RouterUser의 권한을 분리하여 계정 유출 시 피해 범위(Blast Radius) 최소화 - lower_case_table_names 설정 불일치 시 전체 재초기화가 필요하므로 구축 전 사전 검증 필수

태그

#MySQL Router #Async Replication #disaster recovery #MySQL InnoDB ClusterSet #GTID

원문 읽기