Hugging Face๊ฐ OVHcloud๋ฅผ Inference Provider๋ก ํตํฉํ์ฌ ๋ชจ๋ธ ํ์ด์ง์์ ์ง์ ์๋ฒ๋ฆฌ์ค ์ถ๋ก ํธ์ถ ๊ฐ๋ฅ
OVHcloud on Hugging Face Inference Providers ๐ฅ
AI ์์ฝ
Context
Hugging Face Hub ์ฌ์ฉ์๋ค์ด ๋ชจ๋ธ์ ํ์ฉํ ๋ ๋จ์ผ ์ถ๋ก ์ ๊ณต์๋ง ์ ํํ ์ ์์ด ์ง์ญ์ฑ, ๊ฐ๊ฒฉ, ๊ธฐ๋ฅ ์ธก๋ฉด์์ ์ ํ์ ์ด์๋ค. ์ ๋ฝ ์ฌ์ฉ์๋ค์ ๋ฐ์ดํฐ ์ฃผ๊ถ๊ณผ ์ง์ฐ์๊ฐ ์๊ตฌ์ฌํญ์ ์ถฉ์กฑํ๋ ์ถ๋ก ์ธํ๋ผ์ ๋ถ์กฑ์ผ๋ก ์ด๋ ค์์ ๊ฒช๊ณ ์์๋ค.
Technical Solution
- OVHcloud๋ฅผ Inference Provider๋ก Hugging Face Hub์ ๋ฑ๋ก: ๋ชจ๋ธ ํ์ด์ง UI์์ OVHcloud ์ ํ ๊ฐ๋ฅํ๋๋ก ๊ตฌํ
- ์๋ฐฉํฅ ์ธ์ฆ ์ง์: ์ฌ์ฉ์ API ํค ์ง์ ์ฌ์ฉ(Custom Key ๋ชจ๋) ๋๋ Hugging Face ํ ํฐ์ผ๋ก ์๋ ๋ผ์ฐํ (Routed by HF ๋ชจ๋) ์ต์ ์ ๊ณต
- Python(huggingface_hub >= 1.1.5) ๋ฐ JavaScript(@huggingface/inference) ํด๋ผ์ด์ธํธ SDK ํตํฉ: ๋ชจ๋ธ๋ช ์ ":ovhcloud" ์ ๋ฏธ์ฌ ์ถ๊ฐ๋ก ์ ๊ณต์ ์ง์
- ์ฌ์ฉ์ ๊ณ์ ์ค์ ์์ ์ ๊ณต์ API ํค ์ ์ฅ ๋ฐ ์ฐ์ ์์ ๊ด๋ฆฌ ๊ธฐ๋ฅ ์ถ๊ฐ
- ๊ตฌ์กฐํ๋ ์ถ๋ ฅ, ํจ์ ํธ์ถ, ๋ฉํฐ๋ชจ๋ฌ(ํ ์คํธ/์ด๋ฏธ์ง) ๊ธฐ๋ฅ ์ง์ํ๋ OVHcloud AI Endpoints ํ๋ซํผ ํตํฉ
Impact
OVHcloud AI Endpoints๋ ์ฒซ ํ ํฐ ์๋ต์๊ฐ 200ms ๋ฏธ๋ง ์ ๊ณต, โฌ0.04/๋ฐฑ๋ง ํ ํฐ ๊ฐ๊ฒฉ๋ ์ง์, Hugging Face PRO ์ฌ์ฉ์์๊ฒ ๋งค์ $2 ์ถ๋ก ํฌ๋ ๋ง ์ ๊ณต
์ค์ฒ ํฌ์ธํธ
Hugging Face Hub๋ฅผ ์ฌ์ฉํ๋ ๊ฐ๋ฐํ์์ ๋ค์ค ์ถ๋ก ์ ๊ณต์(OVHcloud, OpenAI ๋ฑ)๋ฅผ SDK๋ก ํตํฉํ ๋, ๋ชจ๋ธ๋ช ์ ์ ๊ณต์๋ช ์ ์ ๋ฏธ์ฌ๋ก ์ถ๊ฐํ๋ ๋จ์ํ ๋ฌธ๋ฒ ๊ท์น์ผ๋ก ์ ๊ณต์ ์ ํ์ด ๊ฐ๋ฅํ๋ฉฐ, ์ฒญ๊ตฌ ๋ฐฉ์(์ง์ ๋๋ Hub ๋ผ์ฐํ )์ ์ ํํด ๋น์ฉ ์ต์ ํ์ ๋ฐ์ดํฐ ์ฃผ๊ถ์ ๋์์ ๋ฌ์ฑํ ์ ์๋ค.