피드로 돌아가기
GeekNewsInfrastructure
원문 읽기
AWS 엔지니어, Linux 7.0에서 PostgreSQL 성능이 절반으로 감소했다고 보고 – 수정이 쉽지 않을 수 있음
Linux 7.0 커널 업데이트로 인한 PostgreSQL 성능 49% 급락 사례
AI 요약
Context
Linux 7.0 커널의 선점 모드 제한 변경으로 인한 PostgreSQL 처리량 저하 발생. User Space Spinlock 사용 시 CPU 자원 낭비가 심화되는 구조적 결함 노출. Graviton4 서버 환경에서 성능 회귀 현상 집중 발생.
Technical Solution
- 커널 선점 모드 제한 변경으로 인한 스케줄링 효율 저하 및 User Space Spinlock 지연 시간 증가
- PREEMPT_NONE 기본값 복원을 통한 커널 수준의 선점 방식 롤백 시도
- RSEQ(Restartable Sequences) 타임 슬라이스 확장을 활용한 락 홀더 선점 노출 제한 설계 제안
- User Space Spinlock을 제거하고 최신 커널의 동기화 메커니즘으로 전환하는 애플리케이션 수정 방향 제시
- Huge Pages 활성화를 통한 메모리 관리 효율 개선 및 Spinlock 병목 현상 완화 전략 적용
Impact
- Graviton4 서버 기준 처리량 기존 커널 대비 0.51배 수준으로 감소
Key Takeaway
운영체제 커널의 저수준 스케줄링 정책 변경은 애플리케이션의 동기화 primitive 설계 방식에 따라 치명적인 성능 회귀를 유발할 수 있음. 하드웨어 아키텍처와 커널 최적화 기능을 고려한 현대적인 동기화 라이브러리 도입의 중요성 확인.
실천 포인트
최신 Linux 커널 도입 전 Huge Pages 설정 여부를 확인하고, 고성능 DB 환경에서는 User Space Spinlock 의존성을 제거할 것