피드로 돌아가기
Dev.toAI/ML
원문 읽기
S3 Vectors 기반 RAG 구축을 통한 비용 최적화 및 0.86 유사도 검색 달성
I Let My AI Agent Build a Bedrock RAG Knowledge Base, Here Are the 2 Mistakes the AWS Agent Toolkit Caught
AI 요약
Context
기존 OpenSearch Serverless의 상시 실행 비용 부담을 해결하기 위해 서버리스 기반의 Amazon S3 Vectors를 활용한 RAG 아키텍처 설계. AI 에이전트의 학습 데이터 최신성 부족으로 인한 API 할루시네이션과 설정 오류를 극복하는 것이 핵심 과제.
Technical Solution
- 비용 최적화를 위해 상시 컴퓨팅 비용이 없는 Amazon S3 Vectors를 Vector Store로 채택
- Titan Text Embeddings V2 모델의 1024-dim 벡터 규격에 맞춘 Cosine Distance Metric 인덱스 설계
- Bedrock의 최신 배포 정책인 Inference Profile ID(Cross-region) 방식을 적용하여 Model Lifecycle 종료 문제 해결
- 데이터 인제스션을 위해 AMAZON_BEDROCK_TEXT 및 METADATA 키를 포함한 비필터링 메타데이터 설정 강제
- 300 Tokens 크기의 고정 청킹과 20% Overlap 전략을 통한 컨텍스트 보존 및 검색 효율 최적화
- Confused Deputy 문제를 방지하기 위한 IAM Trust Policy 및 Least-privilege 권한 제어 적용
실천 포인트
- Bedrock 모델 호출 시 bare ID 대신 Inference Profile ID 사용 여부 확인 - S3 Vectors 인덱스 생성 시 Bedrock 전용 메타데이터 키(TEXT, METADATA) 정의 여부 점검 - Embedding 모델의 Dimension과 Vector Store의 Index Dimension 일치 여부 검증 - IAM Role 설정 시 aws:SourceArn을 통한 구체적인 리소스 범위 제한 적용