피드로 돌아가기
How I built a Social Recipe Extractor that turns short-form video links into structured recipes
Dev.toDev.to
Backend

비정형 소셜 콘텐츠의 구조적 레시피 전환을 위한 파이프라인 설계

How I built a Social Recipe Extractor that turns short-form video links into structured recipes

Rusu Ionut2026년 5월 13일4intermediate

Context

소셜 미디어 영상 내 레시피 정보가 캡션이나 음성 등 비정형 데이터로 산재하여 사용자 접근성이 낮은 문제 발생. 단순 텍스트 추출을 넘어 서비스 재사용이 가능한 구조화된 데이터 모델로의 변환 필요성 대두.

Technical Solution

  • Parsing Logic의 서버 집중 배치를 통한 플랫폼별 Rate Limit 및 Caching 제어권 확보
  • URL Normalization 과정을 통한 동일 콘텐츠의 중복 처리 방지 및 데이터 일관성 유지
  • Raw Text에서 구조적 객체(Title, Ingredients, Instructions)로 변환하는 단계적 Extraction Pipeline 구축
  • 데이터 정제 레이어를 통한 해시태그 및 노이즈 제거로 정제된 Recipe Object 생성
  • 사용량 기반 Usage Model을 응답 페이로드에 포함하여 UI 단의 선제적 권한 제어 구현

- 외부 플랫폼 API 연동 시 클라이언트가 아닌 백엔드 중심의 Parsing Boundary 설정 - 비정형 데이터 처리 시 정규화(Normalization)와 정제(Cleanup) 단계를 분리하여 데이터 품질 확보 - 반복 요청이 예상되는 외부 데이터 추출 기능에 Canonical URL 기반의 Caching 계층 도입

원문 읽기