피드로 돌아가기
Predictive Alpha: Pipeline Engineering for Real-Time Machine Learning Inference
Dev.toDev.to
AI/ML

Sub-millisecond Feature Engineering 기반 실시간 ML 추론 파이프라인 설계

Predictive Alpha: Pipeline Engineering for Real-Time Machine Learning Inference

mountek2026년 6월 14일6advanced

Context

기존 RSI, MACD 등 지연 지표 중심의 기술적 분석은 실시간 시장 대응에 한계가 존재함. 특히 ML 모델을 프로덕션에 적용 시 Feature Transformation 및 Inference 단계의 지연 시간이 예측 데이터의 유효성을 상실시키는 병목 지점으로 작용함.

Technical Solution

  • DB 집계 쿼리 대신 Redis 및 NumPy 기반의 in-memory Sliding Ring-Buffer Pattern을 도입하여 Feature 생성 지연 최소화
  • Order Book Imbalance(OBI) 등 미시 구조 특징량을 RAM 내에서 즉시 계산하는 Non-blocking Feature Generator 설계
  • WebSocket 네트워크 스레드와 모델 추론 로직을 분리하기 위해 Multiprocessing Worker Pool 구조 채택
  • Python의 GIL 병목을 회피하고 실행 속도를 높이기 위해 모델 가중치를 ONNX Runtime 또는 TensorRT로 직렬화하여 C++ 메모리 공간에서 실행
  • 모델의 연속적 확률값(Continuous Probability)을 Symmetric Threshold Filter와 Risk-adjusted Sizing Function을 통해 이산적 주문 페이로드로 변환

1. 실시간 피처 계산 시 DB 의존성을 제거하고 In-memory Ring-Buffer 구조를 검토했는가?

2. 모델 추론 프로세스가 메인 네트워크 I/O 스레드를 블로킹하고 있지는 않은가?

3. Python 환경에서 성능 최적화를 위해 ONNX 등 최적화된 런타임 엔진을 도입했는가?

4. 모델의 확률 출력을 실제 실행 값으로 변환하는 안전장치(Sizing Function)가 설계되었는가?

원문 읽기