Hugging Face Hub๊ฐ Hyperbolic, Nebius AI Studio, Novita 3๊ฐ serverless inference provider๋ฅผ ์ถ๊ฐ๋ก ์ง์ํจ์ผ๋ก์จ ๋ชจ๋ธ ํ์ด์ง์์ ์ง์ DeepSeek-R1, Flux.1 ๋ฑ ๋ค์ํ ๋ชจ๋ธ ์ ๊ทผ ๊ฐ๋ฅ
Introducing Three New Serverless Inference Providers: Hyperbolic, Nebius AI Studio, and Novita ๐ฅ
AI ์์ฝ
Context
Hugging Face Hub๋ ๊ธฐ์กด์ Together AI, Sambanova, Replicate, fal, Fireworks.ai 5๊ฐ์ serverless inference provider๋ง ์ง์ํ๊ณ ์์์ผ๋ฉฐ, ์ฌ์ฉ ๊ฐ๋ฅํ ๋ชจ๋ธ๊ณผ ๊ณต๊ธ์ ์ ํ์ง๊ฐ ์ ํ์ ์ด์๋ค.
Technical Solution
- 3๊ฐ ์ ๊ท serverless inference provider ํตํฉ: Hyperbolic, Nebius AI Studio, Novita๋ฅผ Hub ๋ชจ๋ธ ํ์ด์ง์ ์ง์ ์ฐ๋
- ์ด์ค ์ธ์ฆ ๋ฐฉ์ ๊ตฌํ: ์ฌ์ฉ์ ์์ ์ API ํค๋ฅผ ์ฌ์ฉํ ์ง์ ํธ์ถ(Custom key) ๋๋ Hugging Face ๊ณ์ ์ ํตํ ๋ผ์ฐํ (Routed by HF) ์ ํ ๊ฐ๋ฅ
- ์ฌ์ฉ์ ์ค์ ์์ provider ์์ ์ง์ ๊ธฐ๋ฅ ์ ๊ณต: ๋ชจ๋ธ ํ์ด์ง ์์ ฏ๊ณผ ์ฝ๋ ์ค๋ํซ์์ ์ ํธํ๋ provider ์์๋๋ก ํ์
- Python huggingface_hub SDK์์ InferenceClient์ provider ํ๋ผ๋ฏธํฐ๋ก provider๋ช
์ง์ :
InferenceClient(provider="hyperbolic", api_key="...") - JavaScript @huggingface/inference SDK์์ chatCompletion ํธ์ถ ์ provider ํ๋ผ๋ฏธํฐ ์ถ๊ฐ:
await client.chatCompletion({model: "...", provider: "novita", ...}) - ์ฒญ๊ตฌ ๋ชจ๋ธ ์ด์ํ: Custom key ์ฌ์ฉ ์ ํด๋น provider ๊ณ์ ์ผ๋ก ์ฒญ๊ตฌ, Routed by HF ๋ฐฉ์ ์ Hugging Face ๊ณ์ ์ผ๋ก ์ฒญ๊ตฌ
Impact
PRO ์ฌ์ฉ์๋ ๋งค์ $2 ์๋น์ Inference credits ์ ๊ณต๋ฐ์.
Key Takeaway
Serverless inference provider๋ฅผ ์ถ์ํ ๊ณ์ธต์ผ๋ก ํตํฉํ๋ฉด ์ฌ์ฉ์๊ฐ ๋์ผํ SDK ์ฝ๋ ๊ตฌ์กฐ ์์์ provider๋ช ๋ง ๋ณ๊ฒฝํ์ฌ ์ ์ฐํ๊ฒ ์๋น์ค๋ฅผ ์ ํํ ์ ์์ผ๋ฉฐ, ์ฒญ๊ตฌ ๋ฐฉ์ ์ ํ์ง๋ฅผ ์ ๊ณตํจ์ผ๋ก์จ ๋น์ฉ ์ต์ ํ์ ์์กด์ฑ ์ ์ด๋ฅผ ๋์์ ๋ฌ์ฑํ ์ ์๋ค.
์ค์ฒ ํฌ์ธํธ
LLM API๋ฅผ ํตํฉํ๋ ์ ํ๋ฆฌ์ผ์ด์ ์์ provider๋ฅผ ํ๋ผ๋ฏธํฐํ๋ ํด๋ผ์ด์ธํธ ์ถ์ํ๋ก ๊ฐ์ธ๋ฉด, InferenceClient(provider=๋ณ์๋ช )์ฒ๋ผ ๋จ ํ ๊ณณ์ ์ค์ ๋ณ๊ฒฝ๋ง์ผ๋ก ์ฌ๋ฌ ์๋ํํฐ inference provider๋ฅผ ์ ํํ ์ ์์ด ๊ณต๊ธ์ ์ข ์์ฑ์ ์ค์ด๊ณ ๋ชจ๋ธ ๊ฐ์ฉ์ฑ์ ๋์ผ ์ ์๋ค.