피드로 돌아가기
Dev.toAI/ML
원문 읽기
Hybrid Structured-Semantic Search를 통한 200ms 내 고정밀 매물 검색 구현
How Natural Language Search Actually Works for Property Listings
AI 요약
Context
기존의 Filter Dropdown UI 기반 검색은 사용자 의도(Intent)를 세분화된 필터에 강제로 매핑해야 하는 제약 존재. 특히 지리적 모호성과 비정형 요구사항을 처리하지 못해 검색 정확도가 저하되는 구조적 한계 노출.
Technical Solution
- GPT-4o 기반의 Structured Extraction Pipeline을 구축하여 자연어를 Typed JSON Schema로 변환하는 Translation Layer 설계
- LLM의 지리적 추론 한계를 극복하기 위해 Neighborhood/Station 데이터를 Lat/Lng Bounding Box로 매핑한 Static Lookup Table 도입
- 정밀한 제약 조건 충족을 위해 Vector Search 전 Postgres 기반의 Structured Query Filtering을 선행하는 Hard-Filter 우선 전략 채택
- 'Quiet', 'Modern' 등 정성적 요구사항 해결을 위해 OpenAI text-embedding-3-small 기반의 Semantic Re-ranking 레이어 추가
- Structured Match와 Semantic Score를 70:30 비율로 블렌딩하여 정밀도와 유연성을 동시에 확보한 하이브리드 랭킹 로직 구현
실천 포인트
1. 정밀한 수치 제약(Price, Bed)은 Vector Search가 아닌 SQL Filter로 먼저 처리했는가?
2. 지리적/도메인 특화 지식은 LLM 프롬프트 대신 정적 매핑 테이블(Lookup Table)로 관리하는가?
3. 정형 데이터 검색 결과와 시맨틱 유사도 점수의 가중치(Blend Ratio)를 실제 데이터 기반으로 튜닝했는가?