Dependency Pinning과 Canary 검증을 통한 Enterprise Airflow 무중단 마이그레이션 전략
Airflow Version Upgrade for Enterprises: A Practical Blueprint for AWS, Snowflake, dbt, and Fintech Data Platforms
Airflow Version Upgrade for Enterprises: A Practical Blueprint for AWS, Snowflake, dbt, and Fintech Data Platforms
Airflow Version Upgrade for Enterprises: A Practical Blueprint for AWS, Snowflake, dbt, and Fintech Data Platforms
We Upgraded Airflow 2.8 to 3.1 on Kubernetes. Here Is What Actually Changed
From SSH to REST: A Security-Driven Modernization of Slack’s EMR Data Pipelines
Part 13 - Local Development and Docker Compose 🐳
Data pipeline around 15 minute city
Building an NLP Pipeline to Classify 225,000 Central Bank Sentences
How I stopped bad data from reaching my warehouse using a single Airflow task
I Built a RAG System to Chat With Newton's Entire Wikipedia
The data engineer's Cortex Code cheat sheet
리디가 AWS SageMaker를 도입해 모델 학습·추론 파이프라인 기술 스택을 간소화하고 학습-추론 분리를 통해 운영 자동화 실현
컬리가 AWS Managed Workflows/GCP Composer에서 Kubernetes 기반 Airflow로 이관하며 CPU 과부하, 워커 OOM, 태스크 로그 손실 등 3가지 운영 이슈를 해결하고 비용 50% 절감
뱅크샐러드가 datapipe 프레임워크를 자체 개발해 데이터 분석가가 직접 데이터 파이프라인을 배포·운영하도록 전환하며 연간 데이터 엔지니어 외 직군의 파이프라인 개발 사례 600건 달성
올리브영이 IDC 기반 ETL 시스템에서 GCP + Airflow + Spark 기반 클라우드 플랫폼으로 전환해 다양한 데이터 원천 수용 및 로그 수집 기능 추가
뱅크샐러드 Data Engineering팀이 LinkedIn Datahub를 도입해 분석 환경의 메타데이터 검색·조회 문제를 중앙집중식 플랫폼으로 해결