피드로 돌아가기
The RegisterDatabase
원문 읽기
Spanner 7.5B QPS 달성 및 Proxy Model 통한 LLM 지연시간 100배 단축
The new database world according to Google: Inexact queries and AI in everything
AI 요약
Context
정밀한 SQL 쿼리 중심의 기존 데이터 플랫폼은 자연어 기반의 유연한 질문 처리와 비정형 데이터 통합에 한계 노출. 특히 LLM 기반 쿼리 생성 시 발생하는 높은 Token 비용과 추론 지연시간이 실시간 운영 데이터베이스 적용의 병목 지점으로 작용.
Technical Solution
- 정형/비정형 데이터 통합 및 유연한 응답 제공을 위한 Vector Indexing 및 Graph 기술 기반 AI Native Infrastructure 설계
- LLM 호출 비용 절감을 위해 데이터 샘플로 즉석 학습되는 경량 Proxy Model을 DB 내부에 배치한 계층적 추론 구조 도입
- AI.IF 등 자연어 조건 평가 함수를 Spanner, AlloyDB, BigQuery 엔진에 내장하여 SQL 내 LLM 추론 로직 직접 결합
- LLM 생성 쿼리의 신뢰성 확보를 위해 대표 질문-정답 쌍으로 구성된 Eval Set 기반의 반복적 Blueprint 최적화 프로세스 구축
- Knowledge Catalog를 통한 전사적 컨텍스트 통합으로 LLM Hallucination 억제 및 답변 정확도 향상
실천 포인트
- LLM 기반 데이터 추출 도입 시, 모든 요청을 LLM으로 보내지 않고 데이터 특성을 반영한 경량 모델(Proxy)의 우선 적용 검토 - AI 생성 쿼리의 품질 검증을 위해 정량적 성능 지표인 Eval Set을 정의하고 지속적 CI/CD 파이프라인에 통합 - 비정형 데이터의 의미론적 검색을 위해 기존 SQL 인덱스 외에 Vector Indexing 및 Graph 기술의 하이브리드 구성 고려