피드로 돌아가기
#1 DevLog Meta-research: I Got Tired of Tab Chaos While Reading Research Papers.
Dev.toDev.to
AI/ML

4개 학술 DB 통합 및 Multi-LLM 기반 논문 분석 플랫폼 구축

#1 DevLog Meta-research: I Got Tired of Tab Chaos While Reading Research Papers.

Arham_Q2026년 4월 25일4intermediate

Context

분산된 학술 데이터 소스로 인한 탐색 비용 증가와 논문 간 관계 파악의 어려움 발생. 기존 툴의 유료화 및 AI 통합 부족으로 인해 Unified Workspace에 대한 기술적 요구 증가.

Technical Solution

  • arXiv, Crossref, OpenAlex, Semantic Scholar API를 통합하여 단일 뷰로 제공하는 Unified Search 로직 설계
  • API별 상이한 응답 포맷과 Rate Limit 해결을 위한 데이터 Schema Normalization 과정 적용
  • 응답 속도 최적화를 위한 Groq(Llama)와 긴 문맥 처리를 위한 Gemini를 조합한 Hybrid LLM 전략 채택
  • 토큰 비용 절감 및 빠른 오버뷰 제공을 위한 Sumy 기반 Local Extractive Summarization 모듈 통합
  • 서버 사이드 Flask 연산과 프론트엔드 JavaScript를 통한 동적 Citation Graph 시각화 구조 구현
  • Flask-Login 및 Werkzeug 기반의 사용자 인증 및 논문 컬렉션 관리 시스템 구축

1. 서로 다른 API 스키마를 통합할 때 공통 정규화 레이어를 설계했는가

2. Task 성격(속도 vs 문맥 길이)에 따라 LLM 모델을 분리하여 운영하고 있는가

3. 외부 API 의존성을 줄이기 위한 Local NLP 폴백(Fallback) 전략이 존재하는가

4. 데이터 간 관계 시각화 시 대규모 데이터셋을 위한 Lazy Loading/Pagination 계획이 수립되었는가

원문 읽기