피드로 돌아가기
Hacker NewsAI/ML
원문 읽기
CCTV 기반 Monocular Metric Depth Estimation을 통한 화물 측정 자동화
Launch HN: Transload (YC P26) – Measuring freight items with CCTV
AI 요약
Context
기존 전용 Dimensioning Station은 지게차 이동 경로 증가와 Dock 정체 등 워크플로우 저해 요인 발생. 이로 인해 많은 터미널이 표본 조사 방식에 의존하며 화물 크기 측정 누락에 따른 수익 손실 발생.
Technical Solution
- 기존 CCTV 인프라를 활용한 Background Measurement 구조 설계로 운영 프로세스 변경 최소화
- Barcode Scan Timestamp와 Handling-unit ID를 기반으로 비디오 내 특정 객체를 매핑하는 Association 로직 구현
- VLM의 낮은 신뢰도를 해결하기 위해 Gaze, Body Orientation, Movement 등 3D 큐를 학습한 전용 모델 도입
- Monocular Metric Depth Estimation 기술을 적용하여 LiDAR 없이 단일 카메라 영상에서 3D Structure 복원
- Object Mask, Visible Edges, Floor Contact 및 Camera Geometry 제약 조건을 결합한 3D Bounding Box 최적화
- 세그멘테이션된 객체로부터 Length, Width, Height 및 Volume을 실측 단위로 산출하는 파이프라인 구축
실천 포인트
1. 비정형 데이터 분석 시 VLM의 범용성보다 도메인 특화 큐(Gaze, Movement)를 학습한 전용 모델의 신뢰도 검토
2. 하드웨어 추가 도입 전, 기존 인프라의 기하학적 제약 조건(Camera Geometry)을 활용한 소프트웨어적 해결 가능성 분석
3. 외부 이벤트(Barcode Scan)의 Timestamp를 트리거로 사용하여 비디오 분석 구간을 좁히는 데이터 정렬 전략 적용