Gemini ๋ฐ Ollama ๊ธฐ๋ฐ AI Avatar ์ ๋๋ฉ์ด์ ์ ์ด ์์คํ ๊ตฌ์ถ
๐ฅAI Chat, AI Cheering Messages, and Animation Editor Hyper (AI Avatar v10: VS Code and Chrome Extension)
AI ์์ฝ
Context
VRoid 3D ์๋ฐํ์ ์ ๋๋ฉ์ด์ ํธ๋ฆฌ๊ฑฐ๋ฅผ ์๋ ์ ๋ ฅ ๋ฐฉ์์์ AI ์ฑํ ๊ธฐ๋ฐ์ ์๋ํ ๊ตฌ์กฐ๋ก ์ ํํ๊ณ ์ ํจ. ๊ธฐ์กด์ ์ ์ ๋ฆฌ์คํธ ๊ธฐ๋ฐ ์์ ๋ฉ์์ง ์์คํ ๊ณผ ์ ํ์ ์ธ ์ ๋๋ฉ์ด์ ํธ์ง ํด๋ก ์ธํ ์ฌ์ฉ์ ๊ฒฝํ ์ ํ๋ฅผ ํด๊ฒฐํด์ผ ํ๋ ์ํฉ.
Technical Solution
- ๋น์ฉ ํจ์จ์ฑ ๋ฐ ์ ๊ทผ์ฑ ํ๋ณด๋ฅผ ์ํด Free plan ์ ๊ณต Gemini 3.1 Flash-Lite API๋ฅผ ๊ธฐ๋ณธ LLM์ผ๋ก ์ฑํ
- ์จํ๋ ๋ฏธ์ค ํ๊ฒฝ ์ง์์ ์ํด Ollama ๊ธฐ๋ฐ Local LLM ํตํฉ ๋ฐ ๋ชจ๋ธ ํฌ๊ธฐ์ ๋ฐ๋ฅธ ์ถ๋ก ์ฑ๋ฅ ๊ฒ์ฆ
- Thinking model(Qwen 3.5)์ ๊ณผ๋ํ ์ถ๋ก ์ผ๋ก ์ธํ Timeout ๋ฐ์ ํ์ธ ํ, ๋น์ถ๋ก ๋ชจ๋ธ์ธ Qwen 2.5:3b๋ก ๊ต์ฒดํ์ฌ ์๋ต ์ง์ฐ ์๊ฐ ๋จ์ถ
- Local LLM์ Cold start ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์ด๊ธฐ ๋ก๋ฉ ์๊ฐ์ ์ต์ ํํ๋ Warm-up ๊ธฐ๋ฅ ๊ตฌํ
- ๋จ์ผ ๋ทฐ ์ค์ฌ์ ํธ์ง ํ๊ฒฝ์ 3-Side Display ๋ฐ Full Tab ๊ตฌ์กฐ๋ก ๊ฐํธํ์ฌ UI/UX ๋ณ๋ชฉ ์ง์ ์ ๊ฑฐ
- JSON ๊ธฐ๋ฐ์ ํ์์ ์ ์ฅ ๋ฐฉ์์์ VRMA ํ์ค ํฌ๋งท ์์ถ ๊ธฐ๋ฅ์ ์ถ๊ฐํ์ฌ ์ธ๋ถ ์ฑ๊ณผ์ ์ํธ์ด์ฉ์ฑ ํ๋ณด
์ค์ฒ ํฌ์ธํธ
- Local LLM ๋์ ์ ๋ชจ๋ธ์ 'Thinking' ํน์ฑ์ด ์ถ๋ก ์ง์ฐ ๋ฐ Timeout์ ๋ฏธ์น๋ ์ํฅ์ ์ฌ์ ์ ๊ฒ์ฆํ ๊ฒ - ํ๋์จ์ด ์ ์ฝ(Low RAM/No GPU) ํ๊ฒฝ์์๋ ๋ชจ๋ธ ํ๋ผ๋ฏธํฐ ํฌ๊ธฐ์ ์๋ต ์๋์ Trade-off๋ฅผ ์ ๋ฐํ๊ฒ ์ธก์ ํ ๊ฒ - ์ด๊ธฐ ์๋ต ์๋ ๊ฐ์ ์ ์ํด ์ ํ๋ฆฌ์ผ์ด์ ์์ ๋จ๊ณ์์ LLM Warm-up ํ๋ก์ธ์ค๋ฅผ ์ค๊ณํ ๊ฒ - ํน์ ํด์ ์ข ์๋์ง ์๋๋ก ๋ฐ์ดํฐ ์ ์ฅ ํฌ๋งท์ ์ฐ์ ํ์ค(์: VRMA)์ผ๋ก ํ์ฅํ ๊ฒ