CCTV 기반 Monocular Metric Depth Estimation을 통한 화물 측정 자동화

Launch HN: Transload (YC P26) – Measuring freight items with CCTV

2026년 6월 9일3분advanced

AI 요약

Context

기존 전용 Dimensioning Station은 지게차 이동 경로 증가와 Dock 정체 등 워크플로우 저해 요인 발생. 이로 인해 많은 터미널이 표본 조사 방식에 의존하며 화물 크기 측정 누락에 따른 수익 손실 발생.

기존 CCTV 인프라를 활용한 Background Measurement 구조 설계로 운영 프로세스 변경 최소화
Barcode Scan Timestamp와 Handling-unit ID를 기반으로 비디오 내 특정 객체를 매핑하는 Association 로직 구현
VLM의 낮은 신뢰도를 해결하기 위해 Gaze, Body Orientation, Movement 등 3D 큐를 학습한 전용 모델 도입
Monocular Metric Depth Estimation 기술을 적용하여 LiDAR 없이 단일 카메라 영상에서 3D Structure 복원
Object Mask, Visible Edges, Floor Contact 및 Camera Geometry 제약 조건을 결합한 3D Bounding Box 최적화
세그멘테이션된 객체로부터 Length, Width, Height 및 Volume을 실측 단위로 산출하는 파이프라인 구축

실천 포인트

1. 비정형 데이터 분석 시 VLM의 범용성보다 도메인 특화 큐(Gaze, Movement)를 학습한 전용 모델의 신뢰도 검토

2. 하드웨어 추가 도입 전, 기존 인프라의 기하학적 제약 조건(Camera Geometry)을 활용한 소프트웨어적 해결 가능성 분석

3. 외부 이벤트(Barcode Scan)의 Timestamp를 트리거로 사용하여 비디오 분석 구간을 좁히는 데이터 정렬 전략 적용

태그