피드로 돌아가기
Dev.toAI/ML
원문 읽기
Gemini 1.5 Flash 기반의 감성 분석과 가중치 랭킹을 적용한 고품질 튜토리얼 필터링 시스템
LearnCurator - I built a YouTube tutorial search engine that filters videos, ranks by AI‑analysed comments
AI 요약
Context
YouTube 검색 결과 내 Shorts 혼입, 언어 불일치, 구버전 콘텐츠 노출 등의 노이즈로 인한 학습 효율 저하 발생. 단순 조회수 기반 랭킹의 한계로 인해 실제 콘텐츠 품질을 판별할 수 있는 정교한 필터링 기제 필요.
Technical Solution
- YouTube Data API v3를 활용한 5분 이상의 롱폼 비디오 한정 데이터 추출 및 Shorts 필터링 구현
- engagementRatio(Likes/Views)와 recencyFactor를 조합한 1차 base score 산출로 기초 후보군 선별
- Gemini 1.5 Flash 모델을 통한 댓글 기반 Sentiment Analysis를 수행하여 커뮤니티 실제 피드백 수치화
- engagement(0.3), recency(0.1), sentiment(0.3), viewBoost(0.3)의 가중치 합산 방식으로 최종 finalScore 랭킹 알고리즘 설계
- Supabase를 통한 사용자 피드백 저장 및 API 응답 캐싱으로 YouTube API 쿼터 제한 문제 해결
- Netlify Functions 기반의 Serverless 아키텍처를 채택하여 인프라 관리 오버헤드 제거
실천 포인트
1. 단순 수치 기반 랭킹의 한계를 극복하기 위해 LLM을 활용한 비정형 데이터(댓글)의 정량적 수치화 방안 검토
2. 외부 API 쿼터 제한 해결을 위한 Supabase 등의 캐싱 레이어 도입 및 데이터 생명주기 설정
3. 1차 가벼운 필터링(Base Score) 후 2차 정밀 분석(AI Analysis)을 수행하는 단계적 파이프라인 설계로 비용 및 리소스 최적화