Build a Cross-Platform Profile Matcher: Find the Same Creator Everywhere
크리에이터 프로필 매칭 도구를 Node.js + SociaVault API + 문자열 유사도 알고리즘으로 구현해 단일 플랫폼 150K 팔로워를 6개 플랫폼 312K 팔로워로 확대 인식
AI 요약
Context
브랜드가 크리에이터와 협업할 때 단일 플랫폼(예: TikTok 150K 팔로워)의 정보만 보유하고 있었습니다. 실제 크리에이터의 전체 도달 범위를 파악하려면 Instagram, YouTube, Twitter 등을 수동으로 검색해야 했고, 사용자명 변형으로 인해 올바른 프로필을 찾기 어려웠습니다.
Technical Solution
- SociaVault API를 통해 6개 플랫폼(TikTok, Instagram, YouTube, Twitter, Threads, LinkedIn)에서 동시 검색 수행
- generateUsernameVariations 함수로 사용자명 변형 생성: 구분자 제거(sarah_creates → sarahcreates), 교체(sarah.creates), 접두사/접미사 추가 및 제거(sarah_createsofficial, sarah_createstv 등) 처리
- Levenshtein 거리 알고리즘으로 문자열 유사도 계산해 사용자명 일치도를 0~100% 범위로 정량화
- scoreMatch 함수로 4가지 신호 조합: 사용자명 유사도(30점), 표시명 유사도(25점), 바이오 키워드 오버랩(20점), 프로필 사진 유사도(25점)
- 신뢰도 분류: 점수 80점 이상 high(높음), 50~79점 medium(중간), 30~49점 low(낮음) 3단계 출력
Impact
단일 TikTok 프로필(148.2K 팔로워)에서 4개 플랫폼 통합 시 총 도달 범위 312.4K로 확장 식별, 평균 팔로워 증가율 110.6%(312.4K ÷ 148.2K - 1) 달성.
Key Takeaway
다중 신호(username, display name, bio, profile picture) 기반 점수 시스템을 구축하면 플랫폼별 사용자명 변형을 자동으로 처리하고 거짓 양성을 필터링할 수 있으며, 브랜드는 정확한 전체 도달 범위를 초 단위로 파악해 협업 가치 판단을 객관화할 수 있습니다.
실천 포인트
소셜 미디어 API를 활용하는 크리에이터 분석, 인플루언서 검색, 고객 프로필 통합 서비스를 개발할 때 Levenshtein 거리 기반 문자열 유사도와 다중 신호 점수(username, display name, bio, profile picture)를 결합하면 플랫폼별 사용자명 변형을 처리하고 신뢰도별 일치 결과를 구분할 수 있어 수동 검증 비용을 줄일 수 있습니다.