Hugging Face๊ฐ Public AI๋ฅผ Inference Provider๋ก ํตํฉํด vLLM ๋ฐฑ์๋์ ๊ธ๋ก๋ฒ ๋ก๋ ๋ฐธ๋ฐ์ฑ์ ํตํ ๋ถ์ฐ ์ถ๋ก ์ธํ๋ผ ์ ๊ณต
Public AI on Hugging Face Inference Providers ๐ฅ
AI ์์ฝ
Context
Hugging Face Hub์ ๋ชจ๋ธ ํ์ด์ง์์ ๋ค์ํ ์ถ๋ก ์ ๊ณต์์ ์ ๊ทผํ๊ธฐ ์ํด์๋ ๊ฐ๊ฐ์ API ํค ๊ด๋ฆฌ์ ๋ณ๋์ ํตํฉ์ด ํ์ํ๋ค. ๊ณต๊ฐ AI ๋ชจ๋ธ๋ค(Swiss AI Initiative, AI Singapore ๋ฑ)์ ํ์ฉํ๋ ค๋ ์ฌ์ฉ์๋ค์ด ํ๋ซํผ ๊ฐ ์ ๊ทผ์ฑ ๋ฌธ์ ๋ฅผ ๊ฒช๊ณ ์์๋ค.
Technical Solution
- Inference Provider ํตํฉ ๊ตฌ์กฐ ๋์ : Public AI๋ฅผ Hugging Face Hub์ ๊ณต์ Inference Provider๋ก ๋ฑ๋กํ์ฌ ๋ชจ๋ธ ํ์ด์ง์ ์ง์ ํ์
- vLLM ๊ธฐ๋ฐ ๋ฐฑ์๋ ๋ฐฐํฌ: OpenAI ํธํ API๋ฅผ ๋ ธ์ถํ๋ vLLM ์๋ฒ๋ฅผ ์ฌ๋ฌ ๊ตญ๊ฐ์ ํํธ๋ ํด๋ฌ์คํฐ์ ๋ถ์ฐ ๋ฐฐํฌ
- ๊ธ๋ก๋ฒ ๋ก๋ ๋ฐธ๋ฐ์ฑ ๋ ์ด์ด ๊ตฌํ: ์์ฒญ ๊ฒฝ๋ก๋ฅผ ์๋์ผ๋ก ์ต์ ํํ์ฌ ์ด๋ ๊ตญ๊ฐ์ ์ปดํจํ ๋ฆฌ์์ค๊ฐ ์ฒ๋ฆฌํ๋ ํฌ๋ช ํ๊ฒ ๋ผ์ฐํ
- ๋์ผ ์ธ์ฆ ๋ชจ๋ ์ง์: ์ฌ์ฉ์ API ํค ์ง์ ์ฌ์ฉ(Custom key) ๋๋ Hugging Face๋ฅผ ํตํ ๋ผ์ฐํ (Routed by HF) ๋ ๊ฐ์ง ํธ์ถ ๋ฐฉ์ ์ ๊ณต
- Python/JavaScript SDK ๋ค์ดํฐ๋ธ ํตํฉ: huggingface_hub(>=0.34.6)๊ณผ @huggingface/inference ํจํค์ง์์ provider="publicai" ํ๋ผ๋ฏธํฐ๋ก ์ฆ์ ์ฌ์ฉ ๊ฐ๋ฅ
- Provider ์ฐ์ ์์ ๊ด๋ฆฌ: ์ฌ์ฉ์ ๊ณ์ ์ค์ ์์ ์ฌ๋ฌ Inference Provider๋ฅผ ์ ํธ๋ ์์๋๋ก ์ค์ ๊ฐ๋ฅ
Impact
Public AI Inference Utility๋ฅผ ํตํ ์ฌ์ฉ๋์ด ํ์ฌ ๋ฌด๋ฃ์ด๋ฉฐ, Hugging Face PRO ์ฌ์ฉ์๋ ๋งค์ $2 ์๋น์ Inference ํฌ๋ ๋ง์ ์ ๊ณต๋ฐ๋๋ค.
Key Takeaway
๋ถ์ฐ ์ถ๋ก ์ธํ๋ผ์์ OpenAI ํธํ API์ ๊ธ๋ก๋ฒ ๋ก๋ ๋ฐธ๋ฐ์ฑ์ ํ์ค์ผ๋ก ์ ๊ณตํ๋ฉด, ์ฌ์ฉ์๊ฐ ๋ณ๋ ์ฝ๋ ์์ ์์ด ์ฌ๋ฌ ์ ๊ณต์๋ฅผ ๋์ผํ ์ธํฐํ์ด์ค๋ก ์ ํํ ์ ์๋ค. ์ด๋ ๋ฉํฐ ํด๋ผ์ฐ๋/๋ฉํฐ ๋ฆฌ์ ์ํคํ ์ฒ ์ค๊ณ ์ API ์ผ๊ด์ฑ๊ณผ ์ ๊ณต์ ๊ฐ ์ ์ฐํ ์ ํ์ ํต์ฌ ์์น์ผ๋ก ์ผ์์ผ ํจ์ ์์ฌํ๋ค.
์ค์ฒ ํฌ์ธํธ
๋๊ท๋ชจ LLM ์ถ๋ก ์๋น์ค๋ฅผ ์ ๊ณตํ๋ ์กฐ์ง์์ OpenAI ํธํ API ํ์คํ์ ํจ๊ป ํด๋ผ์ด์ธํธ SDK์ provider ์ ํ ํ๋ผ๋ฏธํฐ๋ฅผ ์ถ๊ฐํ๋ฉด, ์ถ๋ก ์ ๊ณต์ ๋ณ๊ฒฝ ์ ๋น์ฆ๋์ค ๋ก์ง ์์ ์์ด ๋จ์ผ ์ค์ ์ฝ๋ ๋ณ๊ฒฝ๋ง์ผ๋ก ๋์ฒด ๊ฐ๋ฅํ ์ ์ฐ์ฑ์ ํ๋ณดํ ์ ์๋ค.