피드로 돌아가기
GeekNewsBackend
원문 읽기
Show GN: 매일 쏟아지는 새 IT 서비스, 넷플릭스처럼 둘러보기 - newflix
pgvector 기반 Hybrid Search와 SSG를 적용한 IT 서비스 디스커버리 플랫폼 설계
AI 요약
Context
파편화된 신규 IT 서비스 정보를 효율적으로 탐색하기 위한 고밀도 큐레이션 환경 필요. 단순 키워드 매칭의 한계를 극복하고 의미론적 유사도 기반의 발견 경험을 제공하는 시스템 구축 목표.
Technical Solution
- Voyage AI 임베딩 모델(1024d)을 통한 서비스 특징의 벡터화 및 pgvector HNSW 인덱스 기반의 고속 유사도 검색 구현
- 키워드 기반 검색과 벡터 기반 검색의 결과를 RRF(Reciprocal Rank Fusion)로 결합한 Hybrid Search 구조 설계로 검색 정확도 향상
- React 19와 SSG(Static Site Generation)를 활용한 서비스별 정적 페이지 생성으로 SEO 최적화 및 OG 태그 노출 성능 확보
- Bun 1.3 런타임과 Elysia 프레임워크 기반의 고성능 API 서버 구축을 통한 요청 처리 지연 시간 최소화
- Cloudflare R2 오브젝트 스토리지를 활용한 효율적인 정적 자산 관리 체계 마련
실천 포인트
1. 검색 정확도 향상을 위해 단순 Vector Search가 아닌 Keyword+Vector Hybrid Search 및 RRF 알고리즘 적용 검토
2. 대규모 리스트 공유 최적화를 위해 서비스별 개별 페이지의 SSG Prerender 전략 수립
3. 실시간성보다 조회 성능이 중요한 큐레이션 플랫폼의 경우 HNSW 인덱스를 통한 벡터 검색 최적화 적용