Hugging Face๊ฐ fal, Replicate, Sambanova, Together AI ๋ฑ 4๊ฐ ์๋ฒ๋ฆฌ์ค ์ถ๋ก ์ ๊ณต์๋ฅผ Hub์ ํตํฉํด ๋ชจ๋ธ ํ์ด์ง์ Python/JS SDK์์ ์ง์ ์ ๊ทผ ๊ฐ๋ฅํ๊ฒ ๊ตฌ์ถ
Welcome to Inference Providers on the Hub ๐ฅ
AI ์์ฝ
Context
Hugging Face๋ 2020๋ ์ฌ๋ฆ๋ถํฐ ์์ฒด Serverless Inference API(v1)๋ฅผ ์ ๊ณตํ์ผ๋, ํต์ฌ ๊ฐ์น๋ฅผ ๋ชจ๋ธยท๋ฐ์ดํฐ์ ์ ํ์ ยท์ ์ฅยท๋ฒ์ ๊ด๋ฆฌยท๋ฐฐํฌ๋ก ์ฌ์ ์ํ์ต๋๋ค. ๋์์ fal, Replicate, Sambanova, Together AI ๊ฐ์ ์๋ํํฐ ์๋ฒ๋ฆฌ์ค ์ ๊ณต์๋ค์ด ์ฑ์ฅํ๋ฉด์, ์ฌ์ฉ์๋ค์ด ์ฌ๋ฌ ์ ๊ณต์์ ์ ๊ทผํ๊ธฐ ์ํด ๊ฐ๊ฐ ๋ค๋ฅธ ์ธํฐํ์ด์ค๋ฅผ ์ฌ์ฉํด์ผ ํ๋ ๋ฌธ์ ๊ฐ ๋ฐ์ํ์ต๋๋ค.
Technical Solution
- Hub ๋ชจ๋ธ ํ์ด์ง์ ์ ๊ณต์ ํตํฉ: ๋ชจ๋ธ ํ์ด์ง ๋ด์์ ํธํ๋๋ ์๋ํํฐ ์ถ๋ก ์ ๊ณต์๋ฅผ ์ฌ์ฉ์ ์ ํธ๋ ์์๋ก ํ์ํ๊ณ ์ง์ ์ ํ ๊ฐ๋ฅ
- ํตํฉ SDK ์ธํฐํ์ด์ค ์ ๊ณต: huggingface_hub(Python, v0.28.0+)์ @huggingface/inference(JS)์์
providerํ๋ผ๋ฏธํฐ๋ก ์ ๊ณต์๋ฅผ ์ ํํ๊ธฐ๋ง ํ๋ฉด ๋์ผ API ํธ์ถ ๊ฐ๋ฅ - ์ฌ์ฉ์ ๊ณ์ ์ค์ ์์ API ํค ๊ด๋ฆฌ: ๊ฐ ์ ๊ณต์์ API ํค๋ฅผ ์ฌ์ ์ ๋ฑ๋กํ๊ฑฐ๋, ๋ฑ๋กํ์ง ์์ผ๋ฉด Hugging Face๊ฐ ์๋์ผ๋ก ๋ผ์ฐํ
- ๋ ๊ฐ์ง ์ฒญ๊ตฌ ๋ฐฉ์ ์ ๊ณต: (1) ์ฌ์ฉ์์ ์ ๊ณต์ API ํค ์ง์ ์ฌ์ฉ ์ ํด๋น ์ ๊ณต์์ ์ฒญ๊ตฌ, (2) Hugging Face ์ธ์ฆ ์ฌ์ฉ ์ Hugging Face ๊ณ์ ์ผ๋ก ํ์ค ์ ๊ณต์ ์๊ธ ์ฒญ๊ตฌ
- OpenAI ํธํ HTTP ๋ผ์ฐํ
ํ๋ก์:
https://router.huggingface.co/{provider}์๋ํฌ์ธํธ๋ก cURL ๋ฐ OpenAI ํด๋ผ์ด์ธํธ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ก๋ ์ ๊ทผ ๊ฐ๋ฅ
Impact
PRO ์ฌ์ฉ์์๊ฒ ์ 2๋ฌ๋ฌ ์๋น์ ์ถ๋ก ํฌ๋ ๋ง ์ ๊ณต(๋ชจ๋ ์ ๊ณต์์์ ์ฌ์ฉ ๊ฐ๋ฅ).
Key Takeaway
๋ฉํฐ ์ ๊ณต์ ํ๊ฒฝ์์ ์ถ์ํ ๊ณ์ธต(SDK, ๋ผ์ฐํ ํ๋ก์)์ ์ ๊ณตํ๋ฉด, ์ฌ์ฉ์๊ฐ ์ ๊ณต์ ์ ํ ์ ์ฝ๋ ๋ณ๊ฒฝ์ ์ต์ํํ๋ฉด์ ๋น์ฉ๊ณผ ์ฑ๋ฅ์ ์ต์ ํํ ์ ์์ต๋๋ค.
์ค์ฒ ํฌ์ธํธ
์๋ฒ๋ฆฌ์ค ์ถ๋ก ์๋น์ค๋ฅผ ๊ตฌ์ถํ๋ ํ์์ ์ฌ๋ฌ ์ ๊ณต์๋ฅผ ์ง์ํด์ผ ํ ๋, SDK์ HTTP ๋ผ์ฐํ ํ๋ก์ ๊ณ์ธต์ ํตํด `provider` ํ๋ผ๋ฏธํฐ๋ง ๋ณ๊ฒฝํ๋๋ก ์ค๊ณํ๋ฉด ์ฌ์ฉ์๋ ์ ๊ณต์๋ฅผ ์์ ๋กญ๊ฒ ์ ํํ๋ฉด์ ๋์ผํ ์ฝ๋๋ก ์ ์งํ ์ ์์ต๋๋ค.