외부 호출 11건을 2건으로 줄인 Privacy-First RAG 아키텍처 설계

WordPress AI chat plugins make 6–11 outbound requests per visitor question. Architecture writeup of an alternative.

Jan Michalík2026년 5월 7일4분intermediate

AI 요약

Context

기존 WordPress AI 플러그인이 질문 1회당 6~11개의 외부 API 및 분석 엔드포인트로 데이터를 전송하는 과도한 Data Leakage 발생. LLM 호출 외에도 벤더 백엔드, 다수의 CDN 및 트래커가 사용자 브라우저 핑거프린트와 대화 내용을 수집하는 구조적 결함 식별.

Technical Solution

Vector DB Managed Service 대신 WordPress DB 내 Custom Post Type을 활용한 임베딩 저장 구조 설계
PHP 기반 Cosine Similarity 계산 로직 구현을 통한 외부 Vector DB 의존성 제거 및 쿼리 단순화
요청 처리 후 데이터를 즉시 삭제하는 Stateless Math Endpoint 설계를 통한 사용자 데이터 저장 원천 차단
Google Fonts 및 외부 분석 픽셀을 배제하고 Subset 폰트와 자체 백엔드 분석 도구를 사용하는 Zero Third-party Call 전략 채택
챗봇 질문 데이터를 클러스터링하여 관리자가 승인 후 FAQ 정적 페이지로 발행하는 AI-assisted Content Pipeline 구축

실천 포인트

1. 외부 SDK 도입 전 Network Tab을 통한 실제 Outbound Request 목적지 및 수량 전수 조사

2. 데이터 규모가 제한적인 경우 Managed Service 대신 로컬 DB 기반의 경량 검색 로직 검토

3. 분석 데이터 수집 시 IP 저장 없이 Daily-rotating Salt를 적용한 자체 엔드포인트 설계 고려

4. AI 생성 콘텐츠를 단순 채팅으로 소비하지 않고 SEO 최적화된 정적 페이지로 전환하는 Loop 설계

태그

#WordPress #Data Privacy #Stateless Architecture #RAG #Vector Search

원문 읽기