Google Cloud Run ๊ธฐ๋ฐ Serverless AI ์ํคํ ์ฒ๋ฅผ ํตํ ๋ค๊ตญ์ด ์๋ฏผ ๊ต์ก ์์คํ ๊ตฌํ
๐ณ๏ธ I Built a Civic AI Assistant on Google Cloud Run โ Hereโs What Google Cloud NEXT โ26 Made Me Rethink
AI ์์ฝ
Context
์ธ๋ ๋ด 9์ต ๋ช ์ด์์ ์ ๊ถ์๋ฅผ ๋์์ผ๋ก ํ๋ ๋ณต์กํ ์ ๊ฑฐ ํ๋ก์ธ์ค์ ์ ๋ณด ๊ฒฉ์ฐจ ํด์ ํ์์ฑ ๋๋. ๋จ์ ์ฑ๋ด์ ๋ฒ์ฉ์ ๋ต๋ณ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด ์ฌ์ฉ์ ํ๋กํ ๊ธฐ๋ฐ์ Context-Aware Intelligence ๊ตฌํ ๋ฐ ๋ค๊ตญ์ด ์ง์ ์ฒด๊ณ ๊ตฌ์ถ ์๊ตฌ๋จ.
Technical Solution
- Google Cloud Run ์ฑํ์ ํตํ Serverless ๊ธฐ๋ฐ์ ์ธํ๋ผ ๊ด๋ฆฌ ์ค๋ฒํค๋ ์ ๊ฑฐ ๋ฐ ์๋ ํ์ฅ์ฑ ํ๋ณด
- Llama 3.3 (70B) ๋ชจ๋ธ๊ณผ Groq API๋ฅผ ๊ฒฐํฉํ์ฌ ์ ์ง์ฐ ๊ณ ์ฑ๋ฅ ์ถ๋ก ํ์ดํ๋ผ์ธ ๊ตฌ์ฑ
- ์ฌ์ฉ์ ์ฐ๋ น ๋ฐ ํฌํ ๊ฒฝํ์ ๋ฐ๋ฅธ 7๊ฐ์ง ์ง๋ฅํ ๋ชจ๋(Mode-Based Architecture)๋ฅผ ์ค๊ณํ์ฌ ์๋ต ์ ๋ฐ๋ ํฅ์
- State-machine ๊ธฐ๋ฐ์ ์ธํฐ๋ํฐ๋ธ ์๋ฎฌ๋ ์ด์ ๋ก์ง์ ํตํด ๊ฐ์ ํฌํ ๊ฒฝํ์ ์ ์ฐจ์ ๋ฌด๊ฒฐ์ฑ ๋ณด์ฅ
- Google Translate API๋ฅผ ํตํฉํ์ฌ 13๊ฐ ์ด์์ ์ธ๋ ํ์ง ์ธ์ด๋ก ์ค์๊ฐ ์๋ต ๋ณํ ์ฒด๊ณ ๊ตฌ์ถ
- Docker์ NGINX ๊ธฐ๋ฐ์ ์ปจํ ์ด๋ ํจํค์ง์ ํตํ ์ผ๊ด๋ ๋ฐฐํฌ ํ๊ฒฝ ๋ฐ ์๋น์ค ๊ฐ์ฉ์ฑ ํ๋ณด
์ค์ฒ ํฌ์ธํธ
- ๋๊ท๋ชจ ํธ๋ํฝ ๋ณ๋์ด ์์๋๋ AI ์๋น์ค์ ๊ฒฝ์ฐ Cloud Run๊ณผ ๊ฐ์ Serverless ํ๊ฒฝ ๊ฒํ - ๋จ์ LLM ํธ์ถ ๋์ State-machine์ ํ์ฉํ ์๋๋ฆฌ์ค ๊ธฐ๋ฐ ์ํฌํ๋ก์ฐ ์ค๊ณ ์ ์ฉ - ๋ค๊ตญ์ด ์๋น์ค ์ค๊ณ ์ ๋จ์ ๋ฒ์ญ API๋ฅผ ๋์ด์ ๋ฌธํ์ /์ง์ญ์ Context-aware ํํฐ๋ง ๋ ์ด์ด ์ถ๊ฐ