피드로 돌아가기
StarLens: Gemma 4 as Your Personal Planetarium Guide
Dev.toDev.to
AI/ML

NASA Ephemeris 데이터 기반 Grounding을 통한 Gemma 4 천체 분석 시스템 구축

StarLens: Gemma 4 as Your Personal Planetarium Guide

Jose Angel Munoz2026년 5월 10일4intermediate

Context

LLM의 고질적인 Hallucination 문제로 인해 정밀한 천체 위치 및 궤도 역학 설명 시 신뢰성 확보에 한계 존재. 단순 훈련 데이터에 의존하는 방식으로는 실시간으로 변하는 118,000개 별과 행성의 정밀한 좌표를 처리하기 어려움.

Technical Solution

  • Skyfield 및 Hipparcos 카탈로그를 이용한 Real-time Ephemeris 데이터 계산 엔진 설계
  • 계산된 천체 좌표를 LLM Context로 주입하는 Context Injection 기법을 통한 과학적 Grounding 구현
  • Latency 최적화를 위해 Vision 작업은 gemma4:e4b 모델을, 심층 추론 및 128K Context 활용 작업은 gemma4:31b-cloud 모델로 이원화한 Hybrid Model 전략 채택
  • Vision 모델의 분석 결과를 엔진의 계산 데이터와 대조하는 Cross-Validation 로직을 통해 식별 정확도 검증
  • 128K Context Window를 활용하여 전체 별 카탈로그를 로드함으로써 딥다이브 분석 시 정보 손실 방지
  • Gradio 기반 인터페이스와 Pydantic-settings를 통한 동적 모델 스위칭 및 설정 관리 구조 설계

1. LLM의 환각 방지를 위해 외부 정밀 계산 엔진의 결과값을 System Context로 주입하는 Grounding 패턴 검토

2. 작업 특성(단순 분석 vs 심층 추론)에 따라 모델 크기와 응답 속도를 고려한 Multi-model Routing 설계 적용

3. AI의 비정형 출력물을 정형 데이터(Ephemeris)와 교차 검증하는 Cross-Validation Layer 구축 고려

4. 대규모 데이터셋 처리 시 LLM의 Context Window 크기에 맞춘 최적의 데이터 청크 및 로드 전략 수립

원문 읽기