ํผ๋๋ก ๋์๊ฐ๊ธฐ
Dev.toSecurity
์๋ฌธ ์ฝ๊ธฐ
Dual-Layer Defense ๊ธฐ๋ฐ AI Agent ์ค์๊ฐ ์คํ ์ ์ด ๋ ์ด์ด ๊ตฌ์ถ
#GuardianClaw โ The AI That Watches Your AI ๐ก๏ธ
AI ์์ฝ
Context
AI Agent๊ฐ Shell ๋ช ๋ น ๋ฐ ํ์ผ ์์คํ ์ ์ง์ ์ ๊ทผํ๋ฉฐ ๋ฐ์ํ๋ ๋ณด์ ์ทจ์ฝ์ ์กด์ฌ. ์๋์ ์คํ ์ฌ์ด์ ๊ฒ์ฆ ๋จ๊ณ๊ฐ ๋ถ์ฌํ์ฌ ์ ์ฑ ์ฝ๋ ์ฃผ์ ๋ฐ ๊ถํ ์์น ๊ณต๊ฒฉ์ ๋ฌด๋ฐฉ๋นํ ๊ตฌ์กฐ์ ํ๊ณ ๋ ธ์ถ.
Technical Solution
- Intent์ Execution ์ฌ์ด์ GuardianClaw Interceptor๋ฅผ ๋ฐฐ์นํ Proxy ์ํคํ ์ฒ ์ค๊ณ
- Zero Latency ๋ฌ์ฑ์ ์ํด ๊ฒฐ์ ๋ก ์ ํจํด ๋งค์นญ ๋ฐฉ์์ Rules Engine ์ฐ์ ์ ์ฉ
- ๋ชจํธํ ์ํ ํ์ง๋ฅผ ์ํด NVIDIA NIM(Llama 3.1 Nemotron 70B) ๊ธฐ๋ฐ์ AI Risk Evaluator ์ฐ๋
- Cloudflare Workers๋ฅผ ํตํ Edge ๋ฐฐํฌ๋ก Cold Start ์ ๊ฑฐ ๋ฐ ๊ฒฉ๋ฆฌ๋ ๋ณด์ ํ๊ฒฝ ํ๋ณด
- API Key ๋ณด์์ ์ํ Cloudflare Encrypted Secrets ํ์ฉ ๋ฐ Stateless ์ํคํ ์ฒ ๊ตฌํ
- ์ํ๋์ ๋ฐ๋ผ ALLOW, REVIEW, BLOCK์ผ๋ก ๊ตฌ๋ถํ ๋จ๊ณ์ ์์ฌ๊ฒฐ์ ๋ชจ๋ธ ์ ์ฉ
์ค์ฒ ํฌ์ธํธ
- ๊ณ ์ํ ์์ ์คํ ์ deterministic rules์ AI reasoning์ ๊ฒฐํฉํ ํ์ด๋ธ๋ฆฌ๋ ๊ฒ์ฆ ๋ ์ด์ด ๊ฒํ - ๋ณด์ ๋๊ตฌ์ ๊ฐ์ฉ์ฑ ํ๋ณด๋ฅผ ์ํด Edge Computing ํ๋ซํผ์ ํ์ฉํ Cold Start ์ต์ํ ์ ๋ต ์ ์ฉ - LLM ๊ธฐ๋ฐ ํ๊ฐ ์ Prompt Injection ๋ฐฉ์ง๋ฅผ ์ํ ์ ๋ ฅ ๋ฐ์ดํฐ Sanitization ๊ณต์ ํ์ ํฌํจ