피드로 돌아가기
Dev.toInfrastructure
원문 읽기
VMware 대체제 KubeVirt 1.8, 비용 50% 절감과 하이퍼바이저 독립성 확보
KubeVirt 1.8: The VMware Alternative Is Here
AI 요약
Context
KVM 전용 백엔드 구조로 인한 하이퍼바이저 종속성 발생. 가상화 인프라와 Kubernetes 제어 평면의 분리로 인한 운영 복잡도 증가. 기존 네트워크 설정 변경 시 VM 재시작이 필수적인 가용성 한계.
Technical Solution
- Hypervisor Abstraction Layer(HAL) 도입을 통한 KVM 외 cloud-hypervisor 및 Firecracker 지원 구조 설계
- Intel TDX 기반의 Confidential Computing 적용으로 하드웨어 수준의 암호화 및 증명(Attestation) 체계 구축
- PCIe NUMA Topology Awareness 구현을 통해 GPU와 메모리를 동일 NUMA 도메인에 배치하여 버스 지연 시간 최소화
- Live Network Attachment 업데이트 기능으로 가동 중인 VM의 네트워크 설정 변경 시 무중단 적용 가능 구조 구현
- Changed Block Tracking(CBT) 기반 증분 백업 도입으로 전체 이미지 복사 없이 변경된 블록만 처리하는 효율적 스토리지 전략 적용
- Passt 사용자 공간 네트워킹 플러그인의 코어 컴포넌트 승격으로 네트워크 스택 안정성 강화
Impact
- VMware 대비 인프라 비용 최대 50% 절감
- 단일 프로덕션 환경에서 5,000개 이상의 VM 운용 검증
- 최대 8,000개 VM 테스트 환경에서 virt-api 및 virt-controller의 선형적 메모리 증가 확인
Key Takeaway
특정 벤더 종속성을 탈피하기 위해 추상화 계층(HAL)을 도입함으로써 인프라 유연성을 확보하고 제어 평면을 통합하는 전략적 설계의 중요성.
실천 포인트
AI/HPC 워크로드 배치 시 PCIe NUMA Topology 설정을 통해 Bare-metal 수준의 GPU 성능을 확보할 것