피드로 돌아가기
InfoQInfoQ
Infrastructure

WebRTC Relay-Transceiver 구조를 통한 대규모 저지연 Voice AI 구현

OpenAI Outlines WebRTC Architecture for Low-Latency Voice AI at Scale

Eran Stiller2026년 5월 20일3advanced

Context

기존 WebRTC 미디어 종단 모델의 Kubernetes 환경 내 대규모 포트 관리 한계 및 운영 복잡성 증대. 글로벌 서비스 확장을 위한 빠른 연결 설정과 안정적인 낮은 Round-trip Time 확보가 필수적인 상황.

Technical Solution

  • Relay와 Transceiver로 역할을 분리하여 상태 관리 지점을 단일화한 계층형 아키텍처 설계
  • Lightweight Relay를 통한 패킷의 단순 전달로 public UDP 노출 최소화 및 엣지단 가용성 확보
  • ICE 협상, DTLS 핸드셰이크, SRTP 암호화 등 stateful한 WebRTC 메커니즘을 Transceiver 계층에 집중 배치
  • 1:1 세션 특성에 최적화하여 복잡한 SFU(Selective Forwarding Unit) 대신 전송 효율 중심의 구조 채택
  • 백엔드 서비스나 클라이언트에 복잡성을 전이하지 않고 얇은 라우팅 계층에서 프로토콜 제어 수행

Key Takeaway

프로토콜의 복잡성을 엣지 단일 지점에 격리하고 라우팅 계층을 Stateless하게 유지함으로써 확장성과 유지보수성을 동시에 확보하는 설계 패턴


- Kubernetes 환경에서 대규모 UDP 포트 할당 문제 발생 시 Relay 계층 도입 검토 - 1:N 회의 시스템이 아닌 1:1 AI 세션일 경우 SFU 도입 전 Transceiver 모델의 효율성 비교 - 상태 유지(Stateful) 로직과 단순 전달(Stateless) 로직의 물리적 분리를 통한 스케일링 전략 수립

원문 읽기