피드로 돌아가기
开源量化分析软件功能介绍
Dev.toDev.to
Backend

开源量化分析软件功能介绍

Parquet-SQLite 하이브리드 저장소 기반 제로-DB 의존성 퀀트 분석 플랫폼 구축

Henry Lin2026년 6월 8일5intermediate

Context

전통적인 RDBMS 중심의 퀀트 시스템이 가지는 무거운 인프라 의존성과 대규모 시계열 데이터 처리 시의 성능 저하 문제를 해결해야 하는 상황. 특히 외부 DB 설치 없이 즉각적인 실행이 가능한 경량화된 배포 구조와 실시간 데이터 처리 효율성 확보가 핵심 요구사항으로 식별됨.

Technical Solution

  • 대용량 시계열 데이터는 Columnar Storage인 Parquet 포맷으로 관리하여 I/O 효율을 극대화하고 데이터 로딩 속도를 최적화한 구조 설계
  • 서비스 상태 및 메타데이터는 SQLite를 사용하여 파일 기반의 경량 상태 관리를 구현함으로써 외부 DB 의존성을 완전히 제거한 Zero-Dependency 아키텍처 채택
  • Flask-SocketIO와 Celery를 결합하여 실시간 시장 지표 계산 및 ML 모델 학습과 같은 고부하 작업을 비동기적으로 처리하는 이벤트 기반 파이프라인 구축
  • 화이트리스트 기반의 FactorExpressionEngine을 설계하여 사용자 정의 수식 실행 시 발생 가능한 임의 코드 실행 보안 취약점 제거
  • Ollama 기반의 Local LLM을 연동한 Text2SQL 엔진을 통해 비정형 자연어 쿼리를 정형 SQL로 변환하여 데이터 접근성을 높인 인터페이스 구현
  • 등가중, 평균-분산, 리스크 패리티 등 다양한 포트폴리오 최적화 알고리즘을 서비스 레이어에 캡슐화하여 전략 교체 유연성 확보

1. 대규모 시계열 데이터 처리 시 RDBMS 대신 Parquet와 같은 열 지향 저장소 도입 검토

2. 배포 편의성을 위해 정적 데이터(Parquet)와 동적 상태(SQLite)를 분리하는 하이브리드 저장 전략 적용

3. 사용자 정의 수식 엔진 구현 시 Sandbox 환경 구축 또는 엄격한 화이트리스트 검증 로직 필수 적용

4. CPU 집약적인 ML 학습 작업은 Celery와 같은 Task Queue를 통해 메인 API 스레드와 분리하여 응답성 유지

원문 읽기