피드로 돌아가기
Hacker NewsInfrastructure
원문 읽기
Versity S3 Gateway 도입을 통한 S3 Latency 제거 및 자체 스토리지 전환
Healthchecks.io Now Uses Self-Hosted Object Storage
AI 요약
Context
HTTP POST 요청 바디(최대 100kB) 저장을 위해 Managed S3를 사용했으나, OVHcloud 및 UpCloud의 지속적인 성능 저하와 Timeout 발생으로 서비스 안정성 저하. 특히 1,400만 개의 작은 객체(평균 8KB)와 빈번한 Churn이 발생하는 워크로드에서 Managed 서비스의 신뢰성 한계 직면.
Technical Solution
- 운영 복잡성 최소화를 위해 Cluster 기반 솔루션(Minio, SeaweedFS) 대신 로컬 파일시스템 기반의 Versity S3 Gateway 채택
- Btrfs 파일시스템 도입을 통해 다량의 소형 파일 저장 시 발생하는 Inode 고갈 문제 원천 차단
- NVMe RAID 1 구성의 전용 서버를 구축하여 디스크 장애에 대비한 하드웨어 수준의 가용성 확보
- Wireguard 터널링을 통한 Application 서버와 S3 Gateway 간의 보안 통신 경로 설계
- rsync 기반의 2시간 주기 증분 백업 및 일일 오프사이트 전체 백업 체계 구축을 통한 데이터 내구성 보완
- 단순 바이너리 교체 및 systemd 재시작 구조를 통해 1인 팀의 운영 오버헤드 극소화
실천 포인트
- 소형 파일이 대량으로 발생하는 스토리지 설계 시 ext4 대신 Btrfs 등 Inode 관리가 효율적인 파일시스템 검토 - 1인 운영 환경에서는 기능적 우위보다 업데이트 및 복구 절차가 단순한 도구(Single Binary 등) 우선 고려 - 외부 API 의존성으로 인한 Latency가 서비스 전체의 병목이 될 경우, 자체 호스팅을 통한 네트워크 홉(Hop) 제거 검토