Vector Search 기반 RAG 구조를 통한 LLM 정적 지식 한계 극복 및 동적 컨텍스트 확장

85. Embeddings and Vector Search: Memory for Language Models

Akhilesh2026년 5월 16일17분intermediate

AI 요약

Context

Pretrained weights에 의존하는 LLM의 정적 지식 구조로 인한 최신 정보 반영 불가 및 내부 데이터 접근 제한 문제 발생. 학습 시점 이후의 데이터나 특정 도메인 지식을 처리하지 못하는 Retrieval 부재의 한계점 분석.

Technical Solution

텍스트 데이터를 고정 크기의 dense vector로 변환하는 Embedding 공정 도입
의미론적 유사도 측정을 위한 Cosine Similarity 기반의 Vector Space 거리 계산 로직 적용
all-MiniLM-L6-v2 모델을 활용한 384차원 벡터 공간 상의 Semantic Mapping 구현
쿼리 시점의 실시간 검색을 통해 관련 문서를 LLM의 Context Window에 주입하는 RAG 아키텍처 설계
데이터 밀도 및 검색 정확도 향상을 위한 Overlap 기반의 Chunking 전략 적용
Metadata Filtering을 결합한 Vector Database 구축으로 검색 범위 최적화 및 정밀도 향상

실천 포인트

- MTEB Leaderboard를 통한 태스크 적합 Embedding 모델 선정 - 데이터 특성에 따른 Fixed-size vs Sentence-based vs Overlapping Chunking 전략 비교 검증 - 단순 Vector Search를 넘어 Metadata 필터링을 통한 검색 결과의 Noise 제거 및 정확도 향상

태그

원문 읽기