피드로 돌아가기
Dev.toAI/ML
원문 읽기
Sub-millisecond Feature Engineering 기반 실시간 ML 추론 파이프라인 설계
Predictive Alpha: Pipeline Engineering for Real-Time Machine Learning Inference
AI 요약
Context
기존 RSI, MACD 등 지연 지표 중심의 기술적 분석은 실시간 시장 대응에 한계가 존재함. 특히 ML 모델을 프로덕션에 적용 시 Feature Transformation 및 Inference 단계의 지연 시간이 예측 데이터의 유효성을 상실시키는 병목 지점으로 작용함.
Technical Solution
- DB 집계 쿼리 대신 Redis 및 NumPy 기반의 in-memory Sliding Ring-Buffer Pattern을 도입하여 Feature 생성 지연 최소화
- Order Book Imbalance(OBI) 등 미시 구조 특징량을 RAM 내에서 즉시 계산하는 Non-blocking Feature Generator 설계
- WebSocket 네트워크 스레드와 모델 추론 로직을 분리하기 위해 Multiprocessing Worker Pool 구조 채택
- Python의 GIL 병목을 회피하고 실행 속도를 높이기 위해 모델 가중치를 ONNX Runtime 또는 TensorRT로 직렬화하여 C++ 메모리 공간에서 실행
- 모델의 연속적 확률값(Continuous Probability)을 Symmetric Threshold Filter와 Risk-adjusted Sizing Function을 통해 이산적 주문 페이로드로 변환
실천 포인트
1. 실시간 피처 계산 시 DB 의존성을 제거하고 In-memory Ring-Buffer 구조를 검토했는가?
2. 모델 추론 프로세스가 메인 네트워크 I/O 스레드를 블로킹하고 있지는 않은가?
3. Python 환경에서 성능 최적화를 위해 ONNX 등 최적화된 런타임 엔진을 도입했는가?
4. 모델의 확률 출력을 실제 실행 값으로 변환하는 안전장치(Sizing Function)가 설계되었는가?