Hugging Face๊ฐ Scaleway๋ฅผ Inference Provider๋ก ์ถ๊ฐํ์ฌ ์ ๋ฝ ๋ฐ์ดํฐ์ผํฐ ๊ธฐ๋ฐ ์๋ฒ๋ฆฌ์ค AI ๋ชจ๋ธ ์ถ๋ก ์๋น์ค ํตํฉ
Scaleway on Hugging Face Inference Providers ๐ฅ
AI ์์ฝ
Context
Hugging Face Hub ์ฌ์ฉ์๋ค์ด ๋ค์ํ AI ์ถ๋ก ์๋น์ค๋ฅผ ํตํฉ๋ ๋ฐฉ์์ผ๋ก ์ ๊ทผํ ์ ์์๋ค. ํน์ ์ง์ญ(์ ๋ฝ)์ ๋ฐ์ดํฐ ์ฃผ๊ถ๊ณผ ๋ฎ์ ์ง์ฐ์๊ฐ์ ์๊ตฌํ๋ ์ฌ์ฉ์๋ค์ ์ํ ์ถ๋ก ์ ๊ณต์ ์ ํ์ง๊ฐ ์ ํ์ ์ด์๋ค.
Technical Solution
- Scaleway๋ฅผ Hugging Face Hub์ ๊ณต์ Inference Provider๋ก ๋ฑ๋ก: ๋ชจ๋ธ ํ์ด์ง์์ ์ง์ Scaleway์ ์ถ๋ก ์๋น์ค ์ ํ ๊ฐ๋ฅ
- ํด๋ผ์ด์ธํธ SDK์ Inference Provider ํตํฉ: Python (huggingface_hub >= 0.34.6)๊ณผ JavaScript (@huggingface/inference)์์
provider="scaleway"ํ๋ผ๋ฏธํฐ๋ก ์ ๊ณต์ ์ง์ - ๋ ๊ฐ์ง ์ธ์ฆ ๋ชจ๋ ๊ตฌํ: ์ฌ์ฉ์ API ํค ์ง์ ์ฌ์ฉ ๋๋ Hugging Face ํ ํฐ์ ํตํ ๋ผ์ฐํ
- ์ฌ์ฉ์ ๊ณ์ ์ค์ ์์ API ํค ๊ด๋ฆฌ ๋ฐ ์ ๊ณต์ ์ฐ์ ์์ ์ค์ ๊ธฐ๋ฅ ์ถ๊ฐ
- gpt-oss-120b, Qwen3, DeepSeek R1, Gemma 3 ๋ฑ ์ฃผ์ ์คํ ์์ค ๋ชจ๋ธ ์ง์
Impact
- ์ฒซ ํ ํฐ ์๋ต์๊ฐ(TTFT) 200ms ๋ฏธ๋ง ๋ฌ์ฑ
- ํ ํฐ๋น ๊ฐ๊ฒฉ โฌ0.20/๋ฐฑ๋ง ํ ํฐ๋ถํฐ ์์
- PRO ์ฌ์ฉ์์๊ฒ ์ $2 ์ถ๋ก ํฌ๋ ๋ง ์ ๊ณต
Key Takeaway
Inference Provider๋ฅผ SDK ๋ ๋ฒจ์์ ํตํฉํ๋ฉด ์ฌ์ฉ์๊ฐ ์ ๊ณต์๋ณ API ๋ฌธ๋ฒ ์ฐจ์ด๋ฅผ ํ์ตํ ํ์ ์์ด ํต์ผ๋ ์ธํฐํ์ด์ค๋ก ์ฌ๋ฌ ์ถ๋ก ์๋น์ค๋ฅผ ์ ํ ๊ฐ๋ฅํ๊ฒ ๋๋ค. ๋ฐ์ดํฐ ์ฃผ๊ถ๊ณผ ๋ ์ดํด์ ์๊ตฌ์ฌํญ์ ๋ฐ๋ผ ์ ๊ณต์๋ฅผ ์ ํํ ์ ์๋ ์ ์ฐ์ฑ๋ ํ๋ณด๋๋ค.
์ค์ฒ ํฌ์ธํธ
AI ์๋น์ค๋ฅผ ์ ๊ณตํ๋ ์์ง๋์ด๋ค์ด Hugging Face Hub์ ๊ฐ์ ์ค์ ํ๋ซํผ์ Inference Provider๋ฅผ ๋ฑ๋กํ๋ฉด, ์ฌ์ฉ์๊ฐ ๋ณ๋์ API ์๋ํฌ์ธํธ ๋ณ๊ฒฝ ์์ด `provider` ํ๋ผ๋ฏธํฐ๋ก ์ถ๋ก ์๋น์ค๋ฅผ ์ ํํ ์ ์์ผ๋ฏ๋ก, ์ง์ญ๋ณ ๋ฐ์ดํฐ์ผํฐ, ๋น์ฉ ์ต์ ํ, ์ฑ๋ฅ ์๊ตฌ์ฌํญ์ ๋ฐ๋ฅธ ์ ํ์ ์๋ํํ ์ ์๋ค.