피드로 돌아가기
Dev.toDatabase
원문 읽기
MySQL InnoDB ClusterSet 기반 무중단 DR 체계 구축 및 RPO 수 초대 단축
Setting Up Disaster Recovery for Morpheus Enterprise with MySQL InnoDB ClusterSet — Step by Step
AI 요약
Context
단일 데이터 센터 내 고가용성을 제공하는 InnoDB Cluster의 사이트 전체 장애 대응 한계 노출. 리전 단위 장애 발생 시 서비스 가용성 상실 문제를 해결하기 위한 멀티 사이트 재해 복구(DR) 체계 필요성 증대.
Technical Solution
- Primary Cluster와 Replica Cluster를 Async Replication으로 연결하는 InnoDB ClusterSet 구조 설계
- MySQL Router의 토폴로지 자동 인식 기능을 통한 애플리케이션 Connection String 변경 없는 Failover 구현
- 데이터 일관성 확보를 위해 Character set, Timezone, SQL mode 등 서버 레벨 설정의 정밀한 동기화 수행
- TLS 암호화 및 scoped replicationAllowedHost 설정을 통한 사이트 간 복제 채널 보안 강화
- recoveryMethod: 'clone' 플러그인 활용으로 초기 데이터 동기화 및 복구 프로세스 효율화
- errant GTID 정리 및 Old-Master Fencing 절차 수립을 통한 비정상 Failover 상황의 데이터 무결성 보장
실천 포인트
- 사이트 간 RTT 50ms 초과 시 Write-heavy 워크로드의 GTID 적용 처리량 저하 여부 벤치마크 수행 - binlog_expire_logs_seconds 설정을 최소 7일 이상으로 유지하여 수동 복구 가능 시간 확보 - ClusterAdmin과 RouterUser의 권한을 분리하여 계정 유출 시 피해 범위(Blast Radius) 최소화 - lower_case_table_names 설정 불일치 시 전체 재초기화가 필요하므로 구축 전 사전 검증 필수