피드로 돌아가기
I built ORAG - an organizational RAG and MCP platform in TypeScript
Dev.toDev.to
AI/ML

MCP 표준 기반의 기업용 RAG 플랫폼 설계로 Retrieval Latency 50ms 달성

I built ORAG - an organizational RAG and MCP platform in TypeScript

Anmol Sharma2026년 5월 8일3intermediate

Context

LLM 자체의 성능보다 내부 데이터의 의미 파악 및 권한 제어라는 Context Layer의 부재로 인한 환각 현상 발생. 데이터 소스별 개별 Glue Code 작성 방식의 확장성 한계 및 엔터프라이즈 수준의 접근 제어 필요성 증대.

Technical Solution

  • LangChain.js 기반의 통합 RAG Pipeline 구축을 통한 Notion, Confluence 등 다양한 데이터 소스의 Chunking 및 Embedding 처리
  • Model Context Protocol(MCP) 서버 도입으로 AI Agent와 Knowledge Base 간의 표준화된 인터페이스 제공 및 커스텀 커넥터 개발 공수 제거
  • pgvector 및 Pinecone 활용으로 고성능 Vector Retrieval 구조 설계
  • 설계 초기 단계부터 Role-based Access Control(RBAC)을 내재화하여 데이터 접근 권한 및 워크스페이스 격리 보장
  • Request Tracing과 Latency Breakdown을 포함한 Observability 레이어 구축으로 검색 품질의 정량적 측정 및 디버깅 가능 구조 설계

1. RAG 도입 시 단순 구현보다 Chunking 전략과 Retrieval Scoring의 관측 가능성 확보 여부를 검토할 것

2. 기업 데이터 적용 시 RBAC 및 Audit Log 설계를 사후 추가가 아닌 초기 아키텍처에 통합할 것

3. 다양한 Agent 인터페이스 대응을 위해 개별 API 개발 대신 MCP와 같은 표준 프로토콜 도입을 고려할 것

원문 읽기