피드로 돌아가기
Dev.toInfrastructure
원문 읽기
Object Storage 기반의 Durable State 저장소 t4를 통한 제어 평면 운영 복잡도 제거
Introducing t4
AI 요약
Context
Kubernetes의 etcd와 같은 Raft 기반 Consensus Cluster가 소규모 클러스터 및 Edge 환경에서 유발하는 멤버십 관리와 스냅샷 복구의 운영 오버헤드 발생. 호스팅 제어 평면의 확산에 따라 복구 가능성이 높고 교체가 용이한 경량 Storage Layer에 대한 필요성 증대.
Technical Solution
- S3-compatible Object Storage를 최상위 Durable Boundary로 설정하여 별도 Coordination Database 의존성 제거
- WAL Segments와 Checkpoints를 Object Storage에 직접 기록하여 노드 소실 시 즉각적인 상태 재구축 구현
- Content-addressed SST 파일을 통한 데이터 중복 제거 및 효율적인 Branching 구조 설계
- Local Pebble Database를 Working Set으로 활용하여 Hot Read 성능 확보 및 Object Storage의 지연 시간 상쇄
- Object Store의 Conditional Writes를 이용한 Leader Election 구현으로 분산 합의 알고리즘의 복잡도 경감
- Immutable 파일 공유 방식을 통해 전체 복사 없는 Point-in-time Copy 및 포크 기능 제공
실천 포인트
1. 인프라 상태 저장소 설계 시 Raft 기반의 완전한 합의 모델이 필수적인지 검토
2. 복구 프로세스 단순화를 위해 S3 등 객체 저장소를 Source of Truth로 활용하는 방안 고려
3. 상태 복제 비용 절감을 위해 Content-addressed Storage 및 Copy-on-write 방식의 브랜칭 도입 검토
4. Read 성능 확보를 위해 Local Cache(LSM-tree 기반)와 Remote Durable Store를 분리한 계층형 아키텍처 적용