Sentence Transformers ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ํ์ฉํด ํ ์คํธ๋ฅผ ๋ฒกํฐ ์๋ฒ ๋ฉ์ผ๋ก ๋ณํํ๊ณ ์ฝ์ฌ์ธ ์ ์ฌ๋ ํจ์๋ก ์๋ฏธ๋ก ์ ๊ฒ์์ ๊ตฌํํ๋ ์ฒซ ML ํ๋ก์ ํธ ์์ ๊ฐ์ด๋
Liftoff! How to get started with your first ML project ๐
AI ์์ฝ
Context
ML ์ ๋ฌธ์๋ค์ ํ์ตํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ ํ๊ณผ ์ฒซ ํ๋ก์ ํธ ์ค์ฝํ์์ ์ด๋ ค์์ ๊ฒช๋๋ค. ํนํ ์๋ฒ ๋ฉ, ์๋ฏธ๋ก ์ ๊ฒ์, ์ฝ์ฌ์ธ ์ ์ฌ๋ ๊ฐ์ ๊ฐ๋ ๋ค์ด ์ด์ฌ์์๊ฒ ํผ๋์ ์ผ๊ธฐํ๋ค.
Technical Solution
- Sentence Transformers๋ฅผ ์ฌ์ฉํด ์์์ ํ ์คํธ ๋ฌธ์์ด์ ๋ค์ฐจ์ ๋ฒกํฐ ๊ณต๊ฐ์ ๋ฒกํฐ๋ก ๋ณํ (์: "I'm so glad I learned to code with Python!" โ [0.2, 0.5, 1.3, 0.9])
- util.cos_sim ํจ์๋ก ์๋ฒ ๋ฉ๋ ๋ ๋ฌธ์ฅ์ ์ ์ฌ๋๋ฅผ -1~1 ๋ฒ์์ ์ ์๋ก ๊ณ์ฐ
- ์๋ฒ ๋ฉ๋ ๋ฌธ์ฅ ์ปฌ๋ ์ ์์ ๊ฒ์ ์ฟผ๋ฆฌ์ ๋งค์นญ๋๋ ๋ฌธ์ฅ์ ๋น ๋ฅด๊ฒ ์ฐพ๋ ์๋ฏธ๋ก ์ ๊ฒ์ ํ์ฉ
- msmarco-MiniLM-L-6-v3 ์ฌ์ ํ์ต ๋ชจ๋ธ์ Jupyter ๋ ธํธ๋ถ์์ ๋ก๋ํด ๋ช ๋ถ ๋ด ํ๋กํ ํ์ ์์ฑ
- Gradio Blocks๋ฅผ ์ฌ์ฉํด ๊ตฌํํ ํ๋ก์ ํธ๋ฅผ Hugging Face Spaces์์ ํธ์คํ ํ๊ณ ์๋ฒ ๋ฉ์ Hub์ ์ ์ฅ
- ๋๋์ ๊ฐ์ฌ ์๋ฒ ๋ฉ ์ Sentence Transformers์ Multi-Processor ์ง์์ผ๋ก ์ฒ๋ฆฌ ์๋ ํฅ์
Key Takeaway
Sentence Transformers๋ ์ํ ์ต์ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ๋ํ ๋ฎ์ ์ง์ ์ฅ๋ฒฝ์ ์ ๊ณตํ๋ฉฐ, ํด๋ฌ์คํฐ๋ง, ๋ชจ๋ธ ์ฆ๋ฅ, CLIP ๊ฐ์ ๊ณ ๊ธ ML ๊ฐ๋ ์ผ๋ก ํ์ฅ ๊ฐ๋ฅํ ์ ๋ฌธ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ค. GitHub์์ 8,000๊ฐ ์ด์์ ์คํ๋ฅผ ๋ฐ์๊ณ 3,000๊ฐ ์ด์์ ํ๋ก์ ํธ์์ ์์กดํ๋ ์ํ๊ณ๋ ๋ฌธ์์ ์ปค๋ฎค๋ํฐ ์๋ฃ ํ๋ถ์ฑ์ ๋ณด์ฅํ๋ค.
์ค์ฒ ํฌ์ธํธ
ML ์ด์ฌ์๊ฐ Sentence Transformers๋ก ์ฒซ ํ๋ก์ ํธ๋ฅผ ๊ตฌ์ฑํ ๋, ์ฌ์ ํ์ต ๋ชจ๋ธ์ Jupyter์์ ๋ก๋ ํ ์๋ฒ ๋ฉ ์์ฑ๊ณผ ์ ์ฌ๋ ๊ณ์ฐ์ ๋จผ์ ์คํํ๋ฉด ๊ตฌ์ฒด์ ์ธ ํ๋ก์ ํธ ์์ด๋์ด๋ฅผ ๋น ๋ฅด๊ฒ ๋์ถํ ์ ์๋ค. ๋ํ ์๋ฏธ๋ก ์ ๊ฒ์์ด ํ์ํ ์ค์ ๋๋ฉ์ธ(๊ฐ์ฌ, FAQ, ์ฝ๋)์ ๋ฐ์ดํฐ๋ฅผ ํ๋ณดํ ํ Gradio๋ Hugging Face Spaces๋ก ํ๋กํ ํ์ ์ ๋ฐฐํฌํ๋ฉด ํ์ต ๊ธฐํ๋ฅผ ๋ ๋ฐฐ๋ก ํ์ฉํ ์ ์๋ค.