피드로 돌아가기
Dev.toBackend
원문 읽기
외부 호출 11건을 2건으로 줄인 Privacy-First RAG 아키텍처 설계
WordPress AI chat plugins make 6–11 outbound requests per visitor question. Architecture writeup of an alternative.
AI 요약
Context
기존 WordPress AI 플러그인이 질문 1회당 6~11개의 외부 API 및 분석 엔드포인트로 데이터를 전송하는 과도한 Data Leakage 발생. LLM 호출 외에도 벤더 백엔드, 다수의 CDN 및 트래커가 사용자 브라우저 핑거프린트와 대화 내용을 수집하는 구조적 결함 식별.
Technical Solution
- Vector DB Managed Service 대신 WordPress DB 내 Custom Post Type을 활용한 임베딩 저장 구조 설계
- PHP 기반 Cosine Similarity 계산 로직 구현을 통한 외부 Vector DB 의존성 제거 및 쿼리 단순화
- 요청 처리 후 데이터를 즉시 삭제하는 Stateless Math Endpoint 설계를 통한 사용자 데이터 저장 원천 차단
- Google Fonts 및 외부 분석 픽셀을 배제하고 Subset 폰트와 자체 백엔드 분석 도구를 사용하는 Zero Third-party Call 전략 채택
- 챗봇 질문 데이터를 클러스터링하여 관리자가 승인 후 FAQ 정적 페이지로 발행하는 AI-assisted Content Pipeline 구축
실천 포인트
1. 외부 SDK 도입 전 Network Tab을 통한 실제 Outbound Request 목적지 및 수량 전수 조사
2. 데이터 규모가 제한적인 경우 Managed Service 대신 로컬 DB 기반의 경량 검색 로직 검토
3. 분석 데이터 수집 시 IP 저장 없이 Daily-rotating Salt를 적용한 자체 엔드포인트 설계 고려
4. AI 생성 콘텐츠를 단순 채팅으로 소비하지 않고 SEO 최적화된 정적 페이지로 전환하는 Loop 설계