피드로 돌아가기
GitHub availability report: May 2026
GitHub BlogGitHub Blog
Infrastructure

Azure 마이그레이션 및 DB 분리를 통한 시스템 가용성 및 확장성 확보

GitHub availability report: May 2026

Natalie Guevara2026년 6월 11일11advanced

Context

AI 기반 워크플로우 증가로 인한 트래픽 급증과 Monolith 구조의 공유 장애 지점(Shared Failure Points)으로 인한 가용성 한계 직면.

Technical Solution

  • Azure 전환을 통한 Elastic Capacity 확보 및 Monolith 트래픽의 40% 분산 처리
  • User, Authentication, Authorization 도메인을 독립 서비스로 분리하여 장애 전파(Cascading Failure) 차단
  • Stateless Authentication Token 도입을 통한 요청당 Database Lookup 제거 및 Peak 트래픽 부하 경감
  • DB Schema Migration 시 Dynamic Throttling 및 Automated Circuit Breaker 적용을 통한 리소스 포화 방지
  • Service Account Allowlist 구축을 통한 자동화 시스템의 오작동으로 인한 서비스 중단 방지
  • Upstream Provider 장애 시 모델 단위의 Traffic Shifting을 통한 Failover 체계 구축

- 대규모 테이블 Schema Migration 시 트래픽 저점 시간대 배치 및 부하 기반 동적 제어 적용 여부 검토 - 인증 시스템의 State 제거를 통한 DB 의존성 최소화 및 응답 속도 개선 검토 - 인프라 서비스 계정에 대한 보호 정책(Allowlist) 수립 및 자동화 도구의 권한 제한 설정 확인 - 외부 API 의존 서비스의 경우 모델/엔드포인트 단위의 즉각적인 Traffic Shifting 메커니즘 구현

원문 읽기