ํผ๋๋ก ๋์๊ฐ๊ธฐ
Dev.toAI/ML
์๋ฌธ ์ฝ๊ธฐ
VPN ์ ๋ฉด ์ฐจ๋จ ํ๊ฒฝ์ ๊ทน๋ณตํ Local LLM ๊ธฐ๋ฐ Full-Stack ๊ฐ๋ฐ ํ๊ฒฝ ๊ตฌ์ถ
My AI Experience in Russia as a European๐คฏ
AI ์์ฝ
Context
๋ฌ์์ ๋ด ์์ฉ VPN 99% ์ฐจ๋จ์ผ๋ก ์ธํ GCP, Gemini, Claude ๋ฑ ์ธ๋ถ AI API ์ ๊ทผ ๋ถ๊ฐ ์ํฉ ๋ฐ์. ๊ธฐ์กด Cloud-native ๊ฐ๋ฐ ์ํฌํ๋ก์ฐ๊ฐ ์์ ํ ๋ง๋น๋ ํ๊ฒฝ์์ Enterprise ์์ค์ ์ฝ๋ ์์ฑ ๋ฐ ๋ถ์ ๋ฅ๋ ฅ ํ๋ณด๊ฐ ์๊ธํ ์ํ.
Technical Solution
- GGUF ํฌ๋งท์ Open-weight ๋ชจ๋ธ(Gemma 4, Qwen 2.5 Coder, DeepSeek Coder)์ SSD์ ์ฌ์ ํ๋ณดํ์ฌ ๋คํธ์ํฌ ์์กด์ฑ ์ ๊ฑฐ
- Ollama๋ฅผ ํตํ Local Inference ์๋ฒ ๊ตฌ์ถ์ผ๋ก ์ธ๋ถ API ํธ์ถ ์์ด ๋ก์ปฌ ๋ฆฌ์์ค ๋ด์์ LLM ๊ตฌ๋
- VSCode์ Continue ํ๋ฌ๊ทธ์ธ์ ์ฐ๋ํ์ฌ Autocomplete, Chat, Code Generation ๋ฑ ํ์คํฌ๋ณ ์ ์ฉ ๋ชจ๋ธ์ ๋งคํํ ํ์ด๋ธ๋ฆฌ๋ ์ถ๋ก ๊ตฌ์กฐ ์ค๊ณ
- VRAM ๋ถ์กฑ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด CPU ๋ฐ RAM ๊ธฐ๋ฐ ์ถ๋ก ์ค์ ๊ณผ config.yaml ์ต์ ํ๋ฅผ ํตํ ์์คํ ์์ ์ฑ ํ๋ณด
- Skillware์ Prompt Rewriter๋ฅผ ๋์ ํ์ฌ ํ ํฐ ์ฌ์ฉ๋์ ์์ถํจ์ผ๋ก์จ ์ ํ๋ ๋ก์ปฌ ๋ฆฌ์์ค ๋ด ์ปจํ ์คํธ ์ฒ๋ฆฌ ํจ์จ ๊ทน๋ํ
- Repo-level ์ปจํ ์คํธ ์ฃผ์ ๋ฐ ๋จ๊ณ์ Task Planning ์ค์ ์ ํตํ ๋ณต์กํ Multi-step ์์ง๋์ด๋ง ํ์คํฌ ์ํ ๋ฅ๋ ฅ ๊ตฌํ
์ค์ฒ ํฌ์ธํธ
- ๋คํธ์ํฌ ๋จ์ ์ํฉ์ ๋๋นํ Open-weight ๋ชจ๋ธ(GGUF) ๋ผ์ด๋ธ๋ฌ๋ฆฌ ๊ตฌ์ถ - Ollama + Continue ํ๋ฌ๊ทธ์ธ ์กฐํฉ์ ํตํ Local AI ๊ฐ๋ฐ ํ๊ฒฝ ์ ์ ๊ฒํ - ํ์คํฌ ์ฑ๊ฒฉ(์๋์์ฑ vs ์ฑํ )์ ๋ฐ๋ฅธ ๋ชจ๋ธ ๋ถ๋ฆฌ ๋ฐ Temperature/Context ํ๋ผ๋ฏธํฐ ํ๋ ์ ์ฉ - ๋ก์ปฌ ์ถ๋ก ์ ํ ํฐ ์ต์ ํ๋ฅผ ์ํ Prompt Compression ๊ธฐ๋ฒ ๋์