ํ”ผ๋“œ๋กœ ๋Œ์•„๊ฐ€๊ธฐ
๐Ÿš€ Cloud Run, GKE, or GCE? Choosing Your Compute
Dev.toDev.to
Infrastructure

์›Œํฌ๋กœ๋“œ ํŠน์„ฑ์— ๋”ฐ๋ฅธ GCP Compute ์ตœ์ ํ™” ์ „๋žต ๋ฐ GKE ๊ธฐ๋ฐ˜ AI ์ถ”๋ก  ๊ตฌ์กฐ ์„ค๊ณ„

๐Ÿš€ Cloud Run, GKE, or GCE? Choosing Your Compute

Duncan2026๋…„ 6์›” 30์ผ6๋ถ„intermediate

Context

ํด๋ผ์šฐ๋“œ ์ปดํ“จํŒ… ์„ ํƒ ์‹œ ๋‹จ์ˆœ ๋„๊ตฌ ๋น„๊ต๋ฅผ ๋„˜์–ด ์šด์˜ ์˜ค๋ฒ„ํ—ค๋“œ์™€ ์ธํ”„๋ผ ์ œ์–ด๊ถŒ ์‚ฌ์ด์˜ Trade-off ๋ฐœ์ƒ. ํŠนํžˆ AI ์—์ด์ „ํŠธ์™€ ๋ชจ๋ธ ์ถ”๋ก  ๋„์ž… ์‹œ ๋„คํŠธ์›Œํฌ ๋ ˆ์ดํ„ด์‹œ์™€ GPU ์ž์› ๊ด€๋ฆฌ๋ผ๋Š” ์ƒˆ๋กœ์šด ๋ณ‘๋ชฉ ์ง€์  ์ง๋ฉด.

Technical Solution

  • Stateless HTTP API ๋ฐ ๋งˆ์ดํฌ๋กœ์„œ๋น„์Šค์˜ ์šด์˜ ํšจ์œจ ๊ทน๋Œ€ํ™”๋ฅผ ์œ„ํ•œ Cloud Run ๊ธฐ๋ฐ˜ Serverless ๊ตฌ์กฐ ์ฑ„ํƒ
  • ๋‹ค์ˆ˜ ๋งˆ์ดํฌ๋กœ์„œ๋น„์Šค ๊ฐ„ ๋ณต์žกํ•œ ์„œ๋น„์Šค ๋””์Šค์ปค๋ฒ„๋ฆฌ์™€ ์ •๋ฐ€ํ•œ ๋ฆฌ์†Œ์Šค ์ œ์–ด๋ฅผ ์œ„ํ•œ GKE ๊ธฐ๋ฐ˜ Orchestration ์„ค๊ณ„
  • ์ปค์Šคํ…€ ์ปค๋„ ์š”๊ตฌ์‚ฌํ•ญ ๋ฐ ์ปจํ…Œ์ด๋„ˆํ™” ๋ถˆ๊ฐ€ ๋ ˆ๊ฑฐ์‹œ ๋ชจ๋†€๋ฆฌ์Šค ๋Œ€์‘์„ ์œ„ํ•œ GCE VM ๋ฐฐํฌ ์ „๋žต ์ˆ˜๋ฆฝ
  • ๋ชจ๋ธ๊ณผ ์—์ด์ „ํŠธ ๋กœ์ง์˜ ๋™์ผ ํด๋Ÿฌ์Šคํ„ฐ Co-location ๋ฐฐ์น˜๋ฅผ ํ†ตํ•œ Public Network Hop ์ œ๊ฑฐ ๋ฐ ๋ ˆ์ดํ„ด์‹œ ์ตœ์†Œํ™”
  • GKE Inference Gateway ๋ฐ Gateway API Inference Extension์„ ํ†ตํ•œ KV Cache ๊ธฐ๋ฐ˜ ์š”์ฒญ ๋ผ์šฐํŒ… ๋ฐ GPU Autoscaling ๊ตฌํ˜„
  • ๋‹จ์ˆœ ์‹คํ—˜ ๋‹จ๊ณ„์˜ ๋‹จ์ผ ๋ชจ๋ธ ์ถ”๋ก ์„ ์œ„ํ•œ GCE Deep Learning VM ํ™œ์šฉ์œผ๋กœ ์ดˆ๊ธฐ ์„ค์ • ๋น„์šฉ ์ ˆ๊ฐ

- stateless API/Webhook์ธ๊ฐ€? โ†’ Cloud Run ์šฐ์„  ๊ฒ€ํ†  - ์„œ๋น„์Šค ๊ฐ„ ํ†ต์‹  ๋ณต์žก๋„๊ฐ€ ๋†’๊ณ  ์ •๋ฐ€ํ•œ Scheduling์ด ํ•„์š”ํ•œ๊ฐ€? โ†’ GKE ๋„์ž… - OS ์ปค๋„ ์ˆ˜์ •์ด๋‚˜ ๋ ˆ๊ฑฐ์‹œ ํ™˜๊ฒฝ ์œ ์ง€๊ฐ€ ํ•„์ˆ˜์ ์ธ๊ฐ€? โ†’ GCE ์„ ํƒ - AI ์ถ”๋ก  ๋ชจ๋ธ๊ณผ ๋กœ์ง ๊ฐ„์˜ ์ €์ง€์—ฐ ํ†ต์‹ ์ด ํ•ต์‹ฌ์ธ๊ฐ€? โ†’ GKE ๊ธฐ๋ฐ˜ Co-location ์„ค๊ณ„

์›๋ฌธ ์ฝ๊ธฐ