피드로 돌아가기
I Built a Lightweight Python RAG Orchestrator That Works with SQLite, PGVector and Qdrant
Dev.toDev.to
AI/ML

LLM 의존성을 최소화한 모듈형 Lightweight RAG Orchestrator 설계

I Built a Lightweight Python RAG Orchestrator That Works with SQLite, PGVector and Qdrant

Alexander Ivanov2026년 5월 28일2intermediate

Context

기존 RAG 프레임워크의 과도한 Dependency Graph와 복잡한 설정으로 인한 오버헤드 발생. LLM 중심의 Opinionated Pipeline 구조가 가져오는 낮은 예측 가능성과 높은 비용 문제 해결 필요.

Technical Solution

  • Abstract Storage Layer 도입을 통한 SQLite, PGVector, Qdrant 간의 Database-agnostic 환경 구축
  • Embeddings, Retrievers, Cleaners를 분리한 Pluggable Architecture 설계로 외부 파이프라인 확장성 확보
  • 전체 파이프라인 중 LLM 개입 단계를 최소화하여 처리 속도 향상 및 Deterministic한 결과 도출
  • 최소한의 입력 파라미터 설정을 통한 Fast Onboarding 및 프로덕션 환경의 통합 비용 감소
  • 기존 엔터프라이즈 시스템 및 Local AI Stack과의 유연한 결합을 위한 Lightweight Wrapper 구조 채택

- RAG 파이프라인 설계 시 모든 단계를 LLM에 위임하지 않고 결정론적 로직과 분리했는지 검토 - Vector Database 교체 가능성을 고려하여 Storage Layer 추상화 인터페이스 정의 - 프레임워크의 복잡성보다 시스템의 Portability와 Composability를 우선순위에 둔 모듈 설계 적용

원문 읽기