OpenAI 없이 S-PubMedBert와 ChromaDB로 구축한 Medical RAG 파이프라인

Building a RAG pipeline without OpenAI

Akhilesh2026년 5월 8일2분intermediate

AI 요약

Context

모델의 학습 데이터 의존성으로 인한 Hallucination 발생 및 최신 정보 반영 불가 문제 직면. 외부 지식 베이스를 실시간 참조하여 답변 정확도를 높이는 RAG 아키텍처 도입 필요성 대두.

실천 포인트

1. 도메인 특화 Embedding 모델 선정 여부 검토

2. Vector DB 내 저장 데이터의 정제 상태 및 Noise 제거 확인

3. Retrieval 단계의 Top-k 하이퍼파라미터 최적화 수행

4. 지식 베이스의 데이터 품질과 모델 성능의 상관관계 분석

태그