피드로 돌아가기
Dev.toInfrastructure
원문 읽기
로그 인제스션 80% 감소 및 비용 70% 절감한 로그 최적화 전략
Log Management at Scale: How We Cut Costs 70% Without Losing Signal
AI 요약
Context
일일 2TB의 대규모 로그 인제스션으로 인해 월 $12,000의 비용이 발생함. 실제 장애 대응 시 활용되는 로그 비중이 5%에 불과한 저효율 데이터 저장 구조의 한계 직면.
Technical Solution
- 런타임 환경 변수 변경을 통한 Dynamic Log Level 제어로 상시 WARN 유지 및 장애 시 DEBUG 전환 구조 설계
- Hot(7일), Warm(30일), Cold(365일) 및 Drop으로 구분한 Tiered Retention 정책 도입을 통한 스토리지 비용 최적화
- Regex 기반 파싱 비용 제거를 위해 Key-Value 형태의 Structured Logging으로 전환하여 쿼리 효율성 확보
- Error 및 Slow Request는 전량 유지하고 Success 로그는 10%만 유지하는 Sampling 전략 적용으로 데이터 노이즈 제거
- 로그 가치에 따른 High/Medium/Low 분류 체계 수립을 통한 저장 우선순위 결정
실천 포인트
1. 런타임 로그 레벨 변경 API 구현 여부 확인
2. 비즈니스 중요도 및 레벨별 Tiered Retention 정책 수립
3. 비정형 로그의 Structured Logging 전환 및 Regex 의존성 제거
4. 성공 응답 로그에 대한 확률적 Sampling 로직 적용 검토