Hugging Face Transformers ๋ผ์ด๋ธ๋ฌ๋ฆฌ๊ฐ Vanilla Transformer ๊ธฐ๋ฐ ํ๋ฅ ์ ์๊ณ์ด ์์ธก ๋ชจ๋ธ์ ์ ๊ณตํด ๊ตญ์ ํฌ์ธํธ ์์ธก ๋ฐฉ์์์ ๊ธ๋ก๋ฒ ํ๋ฅ ๋ถํฌ ๋ชจ๋ธ๋ง์ผ๋ก์ ์ ํ ์คํ
Probabilistic Time Series Forecasting with ๐ค Transformers
AI ์์ฝ
Context
๊ณ ์ ์ ์๊ณ์ด ์์ธก ๋ฐฉ์(ARIMA)์ ๊ฐ ์๊ณ์ด์ ๊ฐ๋ณ์ ์ผ๋ก ํ์ตํ๋ ๊ตญ์ ๋ชจ๋ธ์ด๋ฉฐ, ํฌ์ธํธ ๊ฐ๋ง ์ถ๋ ฅํ๋ฏ๋ก ์์ธก์ ๋ถํ์ค์ฑ์ ์ ๊ณตํ ์ ์๋ค๋ ํ๊ณ๊ฐ ์๋ค. ๋๊ท๋ชจ ์๊ณ์ด ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ ๋ ์ฌ๋ฌ ๋ฐ์ดํฐ ์์ค์ ์ ์ฌ ํํ์ ํ์ตํ ์ ์๋ ๊ธ๋ก๋ฒ ๋ชจ๋ธ์ ํ์์ฑ์ด ์ฆ๋๋์๋ค.
Technical Solution
- Encoder-Decoder Transformer ์ํคํ ์ฒ ๋์ : ์ปจํ ์คํธ ์๋์ฐ๋ฅผ ์ธ์ฝ๋์ ์ ๋ ฅํ๊ณ ์์ธก ๊ธธ์ด ํฌ๊ธฐ์ ์๋์ฐ๋ฅผ ์ธ๊ณผ ๋ง์คํฌ ์ ์ฉ ๋์ฝ๋์ ์ ๋ฌํ๋ ๊ตฌ์กฐ ๊ตฌ์ฑ
- ํ๋ฅ ์ ๋ถํฌ ๋ชจ๋ธ๋ง: Gaussian, Student-T ๋ฑ ๋งค๊ฐ๋ณ์ ๋ถํฌ์ ๋ฏธ๋ ํ๋ผ๋ฏธํฐ๋ฅผ ํ์ตํ๋ ๋ฐฉ์์ผ๋ก ๊ตฌํํ๊ณ , ์ํ๋ง์ ํตํด ์์ธก ๋ถํ์ค์ฑ ์ ๊ณต
- ์ํ๊ท ์ธ๋(Ancestral Sampling) ์ ์ฉ: ํ์ต๋ ๋ถํฌ์์ ์ํ๋งํ์ฌ ๋ชฉํ ์์ธก ์งํ๊น์ง ์์ฐจ์ ์ผ๋ก ์์ธก๊ฐ ์์ฑ
- ๊ฒฐ์ธก๊ฐ ์ฒ๋ฆฌ: Attention ๋ง์คํฌ๋ฅผ ํ์ฉํด ๊ฒฐ์ธก๊ฐ์ ๋ณด์กฐ ๋ง์คํฌ๋ก ์ธ์ฝ๋ฉํ์ฌ ๋ฐ์ดํฐ ๋์ฒด/๋์ ์์ด ์ง์ ํ์ต
- GluonTS ๋ฐ์ดํฐ ํฌ๋งท ์ฑํ: ์ํฐํด ์ ๊ณต ๋ ธํธ๋ถ์์ ๋ฐ์ดํฐ๋ฅผ Hugging Face Datasets ํ์์ผ๋ก ๋ณํํ๋ ํ๋ก์ธ์ค ๋ฌธ์ํ
Key Takeaway
Transformer ๊ธฐ๋ฐ ์๊ณ์ด ๋ชจ๋ธ์ ์์ฒ ๊ฐ์ ํ์ ์คํ ์ ์ฒ๋ฆฌํ ์ ์์ผ๋ฉฐ, ๋ค์ค ์๊ณ์ด๋ก๋ถํฐ ๊ณต์ ํํ์ ํ์ตํ๋ ๊ธ๋ก๋ฒ ๋ชจ๋ธ๋ง์ด ๊ฐ๋ฅํ๋ค๋ ์ ์ด ํต์ฌ์ด๋ค. ์ด๋ฅผ ํตํด ๊ณ ์ ์ ๋ฐฉ์์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ณ ์ค์ ์์ฌ๊ฒฐ์ ํ์ดํ๋ผ์ธ์ ํ์ํ ์์ธก ๋ถํ์ค์ฑ์ ์ ๋ํํ ์ ์๋ค.
์ค์ฒ ํฌ์ธํธ
์๊ณ์ด ์์ธก์ด ํ์ํ ํ๋ก๋์ ํ๊ฒฝ์์ Hugging Face Transformers์ TimeSeriesTransformer ๋ชจ๋ธ์ ์ฌ์ฉํ ๋, ์ปจํ ์คํธ ์๋์ฐ ํฌ๊ธฐ์ ์์ธก ๊ธธ์ด๋ฅผ ๋ฐ์ดํฐ์ ์ ์๊ณ์ด ํน์ฑ์ ๋ง๊ฒ ์ค์ ํ๊ณ ํ๋ฅ ๋ถํฌ ํ๋ผ๋ฏธํฐ๋ฅผ ํ์ตํ๋ฉด, ๋จ์ ํฌ์ธํธ ์์ธก๋ง ์ ๊ณตํ๋ ๋ฐฉ์ ๋๋น ์์ธก๊ฐ์ ์ ๋ขฐ๋ ๋ฒ์๋ฅผ ํจ๊ป ์ ๊ณตํ ์ ์์ด ์์ฌ๊ฒฐ์ ์ ์ ํ์ฑ์ ๋์ผ ์ ์๋ค.