피드로 돌아가기
Dev.toAI/ML
원문 읽기
Vector Search 기반 RAG 구조를 통한 LLM 정적 지식 한계 극복 및 동적 컨텍스트 확장
85. Embeddings and Vector Search: Memory for Language Models
AI 요약
Context
Pretrained weights에 의존하는 LLM의 정적 지식 구조로 인한 최신 정보 반영 불가 및 내부 데이터 접근 제한 문제 발생. 학습 시점 이후의 데이터나 특정 도메인 지식을 처리하지 못하는 Retrieval 부재의 한계점 분석.
Technical Solution
- 텍스트 데이터를 고정 크기의 dense vector로 변환하는 Embedding 공정 도입
- 의미론적 유사도 측정을 위한 Cosine Similarity 기반의 Vector Space 거리 계산 로직 적용
all-MiniLM-L6-v2모델을 활용한 384차원 벡터 공간 상의 Semantic Mapping 구현- 쿼리 시점의 실시간 검색을 통해 관련 문서를 LLM의 Context Window에 주입하는 RAG 아키텍처 설계
- 데이터 밀도 및 검색 정확도 향상을 위한 Overlap 기반의 Chunking 전략 적용
- Metadata Filtering을 결합한 Vector Database 구축으로 검색 범위 최적화 및 정밀도 향상
실천 포인트
- MTEB Leaderboard를 통한 태스크 적합 Embedding 모델 선정 - 데이터 특성에 따른 Fixed-size vs Sentence-based vs Overlapping Chunking 전략 비교 검증 - 단순 Vector Search를 넘어 Metadata 필터링을 통한 검색 결과의 Noise 제거 및 정확도 향상