피드로 돌아가기
InfoQInfoQ
Infrastructure

OTLP 네이티브 수집과 PromQL 도입을 통한 Observability 통합

Amazon CloudWatch Introduces OpenTelemetry Metrics Support in Preview

Renato Losio2026년 4월 29일2intermediate

Context

기존 CloudWatch 환경에서 OpenTelemetry 데이터를 활용하기 위해 별도의 변환 파이프라인을 유지해야 했던 운영 부담 존재. 특히 High-Cardinality 데이터 처리의 한계로 인해 메트릭 정보의 손실이나 변환 과정에서의 지연 발생 가능성 상존.

Technical Solution

  • OTLP 프로토콜 기반의 네이티브 Metric Ingestion 구조 채택을 통한 변환 단계 제거
  • 최대 150개 Label을 지원하는 High-Cardinality Metrics Store 도입으로 풍부한 메트릭 컨텍스트 유지
  • AWS Resource Explorer 연동을 통한 Account ID, Region, Cluster ARN 등 리소스 메타데이터 자동 Enrichment 설계
  • Prometheus 생태계 호환성을 위한 PromQL 쿼리 엔진 통합으로 분석 일관성 확보
  • EKS Container Insights에 OpenTelemetry 기반 수집 모델을 적용한 인프라 가시성 확장
  • Traces, Logs에 이은 Metrics 지원으로 OpenTelemetry 3대 Pillar의 통합 수집 체계 완성

1. 기존의 커스텀 메트릭 변환 파이프라인 제거 가능 여부 검토

2. High-Cardinality 메트릭 도입 시 발생할 수 있는 비용 증가분 산정

3. Prometheus 기반 쿼리를 CloudWatch와 Managed Grafana로 이관하는 마이그레이션 계획 수립

4. AWS 리소스 태그와 OTLP 메트릭의 결합을 통한 모니터링 세분화 적용

원문 읽기