Gemma 4:e4b ๊ธฐ๋ฐ Local Privacy Firewall๋ก PII ์ ์ถ ์์ฒ ์ฐจ๋จ
๐ก๏ธ PromptGuard: I Built a Local AI Privacy Firewall That Sanitizes Your Prompts Before They Leave Your Machine
AI ์์ฝ
Context
ํด๋ผ์ฐ๋ LLM ์ฌ์ฉ ์ ๋ฐ์ํ๋ ๋ฏผ๊ฐ ๋ฐ์ดํฐ ์ ์ถ ์ํ๊ณผ PDPA/GDPR ๋ฑ ๋ฒ์ ๊ท์ ์ค์ ํ์์ฑ ์ฆ๋. ๊ธฐ์กด Regex ๋ฐฉ์์ผ๋ก๋ ๋ฌธ๋งฅ ๊ธฐ๋ฐ์ PII(Personally Identifiable Information) ์๋ณ์ ํ๊ณ๊ฐ ์กด์ฌํจ.
Technical Solution
- Chrome Extension๊ณผ Local FastAPI ์๋ฒ๋ฅผ ๊ฒฐํฉํ Local-first ์ํคํ ์ฒ ์ค๊ณ
- Regex๋ฅผ ํตํ ์ ํ ํจํด(Email, Phone ๋ฑ)์ 1์ฐจ ํํฐ๋ง ํ LLM์ ํตํ 2์ฐจ ๋ฌธ๋งฅ ๋ถ์ ์ํ
- Inference ๋น์ฉ๊ณผ ์ถ๋ก ์๋ ์ต์ ํ๋ฅผ ์ํด Mixture-of-Experts(MoE) ๊ตฌ์กฐ์ Gemma 4:e4b ๋ชจ๋ธ ์ฑํ
- 16GB RAM ํ๊ฒฝ์์ Ollama๋ฅผ ํตํด ์จ๋๋ฐ์ด์ค ์ถ๋ก ์ ๊ตฌํํ์ฌ ๋ฐ์ดํฐ ์ธ๋ถ ์ ์ถ ๊ฐ๋ฅ์ฑ ์ ๊ฑฐ
- ์ ํ ๋ฐ์ดํฐ ํจํด ๋งค์นญ๊ณผ ๋น์ ํ ๋ฌธ๋งฅ ์ดํด๋ฅผ ๊ฒฐํฉํ Two-stage Pipeline ๊ตฌ์ถ
Impact
- 16GB RAM ์ฌ์์ ๋ฏธ๋๋ ์ธ์ง ํ๋์จ์ด์์ ํ๋กฌํํธ๋น 2~5s์ ์ง์ฐ ์๊ฐ ๋ฐ์
- 2B/4B ๋ชจ๋ธ์ ๊ณผ๋ํ ์ ๋ณด ์ญ์ ๋ฐ 27B ๋ชจ๋ธ์ ๋๋ฆฐ ์ถ๋ก ์๋ ๋ฌธ์ ๋ฅผ MoE ๋ชจ๋ธ๋ก ํด๊ฒฐ
Key Takeaway
๋ฐ์ดํฐ ํ๋ผ์ด๋ฒ์ ์๊ตฌ์ฌํญ์ด ๋์ ๋๋ฉ์ธ์์๋ Cloud API ๋์ Local LLM์ ํ์ฉํ ์ ์ฒ๋ฆฌ ๊ณ์ธต(Privacy Firewall) ๋ฐฐ์น๊ฐ ํ์์ ์ด๋ฉฐ, ๋ชจ๋ธ ์ ์ ์ ์ถ๋ก ์๋์ ๋ฌธ๋งฅ ์ดํด๋์ Trade-off๋ฅผ ๊ณ ๋ คํ MoE ์ํคํ ์ฒ๊ฐ ํจ์จ์ ์ธ ๋์์ด ๋จ.
์ค์ฒ ํฌ์ธํธ
- PII ํ์ง ์ ์ ๊ทํํ์(Regex)๊ณผ LLM์ ๊ฒฐํฉํ ๊ณ์ธต์ ํํฐ๋ง ๊ตฌ์กฐ ๊ฒํ - Local LLM ๋์ ์ ๊ฐ์ฉ ๋ฉ๋ชจ๋ฆฌ(RAM) ๋๋น ์ถ๋ก ์๋์ ์ ํ๋์ ๊ท ํ์ (Sweet Spot) ๋ชจ๋ธ ํ ์คํธ - ๋ฒ์ ๊ท์ (GDPR, PDPA) ์ค์๋ฅผ ์ํด ๋ฐ์ดํฐ๊ฐ ์ธ๋ถ ๋ง์ผ๋ก ์ ์ก๋๊ธฐ ์ On-device์์ Sanitization ์ํํ๋ ํ์ดํ๋ผ์ธ ์ค๊ณ