๋ฐ์ดํฐ ์ํ๊ณ ์ ๊ณผ์ ์ ์ญํ ๋ถ๋ฆฌ๋ฅผ ํตํ End-to-End ํ์ดํ๋ผ์ธ ์ต์ ํ
I Thought โData Analystโ Was the Whole Gameโฆ Then I Entered the Data Avengers Office ๐
AI ์์ฝ
Context
๋จ์ผ ์ญํ ์ ๋ฐ์ดํฐ ๋ถ์๊ฐ ์ค์ฌ ๊ตฌ์กฐ๋ก๋ ๋๊ท๋ชจ ๋ฐ์ดํฐ์ ์์ง, ์ ์ , ๋ฐฐํฌ ๋ฐ ์์ธก ๋ชจ๋ธ์ ์๋น์คํ๋ผ๋ ๋ณต์กํ ์๊ตฌ์ฌํญ ์ถฉ์กฑ์ ํ๊ณ ๋ฐ์. ์์ ๋ฐ์ดํฐ์ ๋ฌด๊ฒฐ์ฑ ๊ฒฐ์ฌ์ ์์คํ ํ์ฅ์ฑ ๋ถ์กฑ์ผ๋ก ์ธํ ๋นํจ์จ์ ์ด์ ํ๊ฒฝ์ ํด๊ฒฐํด์ผ ํ๋ ์ํฉ.
Technical Solution
- Data Architecture ์ค๊ณ๋ฅผ ํตํ ์ ์ฌ์ ๋ฐ์ดํฐ ์ ์ฅ์ ๋ฐ ์์คํ ์ฐ๊ฒฐ ๊ตฌ์กฐ ์ ์๋ก ํ์ฅ์ฑ ํ๋ณด
- Data Engineering ํ์ดํ๋ผ์ธ ๊ตฌ์ถ์ ํตํ Raw Data์ ์ ์ ๋ฐ ์๋ํ๋ ์์ง/์ด๋ ํ๋ก์ธ์ค ๊ตฌํ
- Data Analysis์ BI Development์ ๋ถ๋ฆฌ๋ฅผ ํตํ ๋น์ฆ๋์ค ํต์ฐฐ๋ ฅ ๋์ถ ๋ฐ ์๊ฐํ KPI ํธ๋ํน ์ต์ ํ
- Data Science์ ์์ธก ๋ชจ๋ธ๋ง๊ณผ ML Engineering์ Production ๋ฐฐํฌ ๋ถ๋ฆฌ๋ฅผ ํตํ ๋ชจ๋ธ ์ฑ๋ฅ์ ์ค์๋น์ค ์ ์ฉ ๊ฐ๋ฅ์ฑ ๊ทน๋ํ
- ์ญํ ๋ณ ์ ์ฉ ์คํ(Spark, Airflow, Kafka, Kubernetes ๋ฑ) ๋์ ์ผ๋ก ๊ฐ ๋จ๊ณ์ ์ฒ๋ฆฌ ๋ณ๋ชฉ ์ง์ ํด์
์ค์ฒ ํฌ์ธํธ
- ๋ฐ์ดํฐ ํ์ดํ๋ผ์ธ ์ค๊ณ ์ ์์ง(Engineer)๊ณผ ๋ถ์(Analyst)์ ์ฑ ์ ์์ญ์ ๋ช ํํ ๋ถ๋ฆฌํ๋๊ฐ - ์คํ์ ๋ชจ๋ธ(Scientist)์ ์ค์ ํธ๋ํฝ ํ๊ฒฝ์ ๋ฐฐํฌํ๊ธฐ ์ํ ML Ops ํ๋ก์ธ์ค๊ฐ ์ ์๋์ด ์๋๊ฐ - ๋น์ฆ๋์ค ์๊ตฌ์ฌํญ์ ๋ฐ๋ฅธ ๋ฐ์ดํฐ ๋ชจ๋ธ๋ง๊ณผ ์์คํ ์ํคํ ์ฒ ์ค๊ณ๊ฐ ์ ํ๋์๋๊ฐ - ๋ฐ์ดํฐ์ ์๋ช ์ฃผ๊ธฐ(Lifecycle)์ ๋ฐ๋ผ ์ ์ ํ ์ ์ฅ์์ ์ฒ๋ฆฌ ๋๊ตฌ๊ฐ ์ ํ๋์๋๊ฐ