피드로 돌아가기
Introducing the AI Model Directory
Dev.toDev.to
AI/ML

35+ AI Provider 메타데이터의 자동 동기화 및 표준화 데이터 레이어 구축

Introducing the AI Model Directory

BestCodes2026년 5월 4일6intermediate

Context

기존 AI 모델 카탈로그들의 파편화된 데이터 구조와 느린 업데이트 주기로 인한 모델 선택의 병목 발생. 특정 서비스에 종속된 Non-agnostic 구조와 데이터 불완전성으로 인해 실시간 모델 벤치마킹 및 라우팅 결정에 한계 노출.

Technical Solution

  • GitHub Actions를 활용한 24시간 주기 자동 Fetching 파이프라인 구축으로 데이터 최신성 유지
  • Provider별 전용 Adapter 패턴을 도입하여 서로 다른 API 응답과 문서를 단일 Shared Schema로 정규화
  • 데이터 저장소로 TOML 파일 트리 구조를 채택하여 Git Diff 기반의 변경 사항 추적 및 다국어 환경에서의 가독성 확보
  • Local Override 메커니즘(metadata.toml)을 통해 자동 생성 데이터와 사용자 정의 데이터의 전략적 병합 구조 설계
  • Zod Schema 기반의 엄격한 Validation 및 하드코딩된 Endpoint 설정을 통한 외부 데이터 주입 공격 방어
  • 대역폭 최적화를 위해 full JSON과 minified JSON 두 가지 배포 버전을 제공하는 정적 데이터 전략 수립

1. 외부 데이터 수집 시 Zod와 같은 Schema Validator를 도입하여 런타임 타입 안정성 확보 여부 검토

2. 데이터 변경 이력 추적과 협업이 필요할 경우 DB 대신 TOML/YAML 기반의 정적 파일 저장 방식 고려

3. 자동화 파이프라인 내 Timeout 설정 및 입력값 Sanitization을 통한 외부 서비스 장애 전파 및 보안 위협 차단 적용

원문 읽기