ํผ๋๋ก ๋์๊ฐ๊ธฐ
Dev.toAI/ML
์๋ฌธ ์ฝ๊ธฐ
Apache 2.0 ๋ผ์ด์ ์ค ๊ธฐ๋ฐ 1.4GB RAM ๊ตฌ๋ ๊ฐ๋ฅํ Edge AI ์ํคํ ์ฒ ๊ตฌํ
Why Google gave away a goldmine for $0? ๐
AI ์์ฝ
Context
๊ธฐ์กด Cloud AI ๋ชจ๋ธ์ ๋์ API ๋น์ฉ๊ณผ ๋ฐ์ดํฐ ํ๋ผ์ด๋ฒ์ ์ ์ฝ์ผ๋ก ์ธํ Edge Computing ์์ ์ฆ๊ฐ. ๊ฑฐ๋ Dense ๋ชจ๋ธ์ ์ฐ์ฐ ๋น์ฉ ๋ฐ ๋ฉ๋ชจ๋ฆฌ ์ ์ ์จ๋ก ์ธํ ์ผ๋ฐ ํด๋ผ์ด์ธํธ ํ๋์จ์ด์ ์คํ ๋ณ๋ชฉ ๋ฐ์.
Technical Solution
- E2B ๋ชจ๋ธ ๋ด Layer-Signals ๊ตฌ์กฐ๋ฅผ ๋์ ํ์ฌ ๊ฐ ๋ ๋ฆฝ ๋ ์ด์ด์ ์ธ๋ถํ๋ ์ปจํ ์คํธ ์ ํธ๋ฅผ ์ฃผ์ ํ ํจ์จ์ ํ ํฐ ๊ด๊ณ ๋ถ์ ์ค๊ณ
- 26B ๋ชจ๋ธ์ Mixture-of-Experts(MoE) ์ํคํ ์ฒ๋ฅผ ์ ์ฉํ์ฌ 128๊ฐ ์ ๋ฌธ ์๋ธ ๋คํธ์ํฌ ์ค 8๊ฐ๋ง ํ์ฑํํ๋ ๋์ ๋ผ์ฐํ ๊ตฌํ
- MoE ๊ตฌ์กฐ๋ฅผ ํตํด ์ ์ฒด ํ๋ผ๋ฏธํฐ ๋๋น ์ค์ ์ฐ์ฐ ๋น์ฉ์ 3.8B ์์ค์ผ๋ก ๋ฎ์ถ ๋ฐํ์ ์ต์ ํ ๋ฌ์ฑ
- Apache 2.0 ๋ผ์ด์ ์ค ์ฑํ์ ํตํ ๋ฒ์ ์ ์ฝ ์ ๊ฑฐ ๋ฐ ํ์ํ ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ Local Fine-Tuning ์์จ์ฑ ํ๋ณด
- ๋ก์ปฌ ํ๋์จ์ด ์ต์ ํ๋ฅผ ํตํ Cloud API ์์กด์ฑ ์ ๊ฑฐ ๋ฐ ๋ฐ์ดํฐ ์ ์ถ ๊ฐ๋ฅ์ฑ์ ์์ฒ ์ฐจ๋จํ ์จ๋๋ฐ์ด์ค ์คํ ํ๊ฒฝ ๊ตฌ์ถ
์ค์ฒ ํฌ์ธํธ
1. ์ ์ฌ์ ํ๋์จ์ด ๋ฐฐํฌ ์ Dense ๋ชจ๋ธ ๋์ MoE ์ํคํ ์ฒ์ Active Parameter ๋น์ค ๊ฒํ
2. ๋ฐ์ดํฐ ๋ณด์ ๊ท์ ๊ฐ ์๊ฒฉํ ๋๋ฉ์ธ(์๋ฃ, ๊ธ์ต ๋ฑ)์์ Apache
2.0 ๊ธฐ๋ฐ Open Weights ๋ชจ๋ธ์ Local Fine-Tuning ๊ฐ๋ฅ์ฑ ๋ถ์
3. ์ธํ๋ผ ๋น์ฉ ์ต์ ํ๋ฅผ ์ํด Cloud API ๊ธฐ๋ฐ ์๋น์ค์์ Local Execution ๋ชจ๋ธ๋ก์ ๋จ๊ณ์ ๋ง์ด๊ทธ๋ ์ด์ ์ ๋ต ์๋ฆฝ