MolmoMotion-1M 기반 범용 3D Motion Forecasting 모델 구현

MolmoMotion: Language-guided 3D motion forecasting

2026년 6월 17일9분advanced

AI 요약

Context

기존 Motion Perception 기술의 사후 분석적 한계와 특정 객체 템플릿 의존성으로 인한 범용성 부족 문제 발생. 텍스트 지시어를 통해 미래 3D 궤적을 예측하는 일반화된 Motion Forecasting 아키텍처 필요성 증대.

실천 포인트

1. 도메인 범용성 확보를 위해 객체별 템플릿 대신 좌표 기반의 Class-agnostic 표현식 검토

2. 결정론적 예측(AR)과 확률적 예측(FM) 모델을 이원화하여 Task 특성에 맞는 아키텍처 선택

3. 3D World Space 좌표계 도입을 통한 Viewpoint-invariant한 데이터 파이프라인 설계

태그