LeRobot이 200개 이상의 병합된 PR과 50명 이상의 신규 기여자를 통해 Unitree G1 휴머노이드 지원, Pi0-FAST 자동회귀 VLA, Real-Time Chunking 추론 기법 도입으로 로봇 학습 플랫폼을 대폭 확장

LeRobot v0.5.0: Scaling Every Dimension

2026년 3월 9일12분intermediate

AI 요약

Context

LeRobot은 기존에 테이블탑 암(arm) 중심의 제한된 로봇 생태계를 보유하고 있었으며, 추론 지연이 발생하는 기존 정책들로 인해 실시간 배포에 한계가 있었다. 또한 단편화된 하드웨어 지원과 레거시 Python 버전에 따른 최신 에코시스템 호환성 문제가 있었다.

Technical Solution

Unitree G1 휴머노이드 전신 제어 추가: Locomotion, Manipulation, Teleoperation, Whole-Body Control(WBC)을 단일 통합 인터페이스로 구현
OpenArm 및 OpenArm Mini 양팔 구성 지원 추가: 쌍팔 조작 작업 가능하도록 양방향 텔레오퍼레이션 장치 통합
Earth Rover 모바일 로봇, OMX Robot 암, SO-100/SO-101 통합, CAN 버스 기반 RobStride·Damiao 모터 컨트롤러 지원 추가
Pi0-FAST 자동회귀 VLA 정책 도입: FAST(Frequency-space Action Sequence Tokenization)를 사용한 Gemma 300M 기반 액션 토크나이저로 이산화된 액션 토큰 생성
Real-Time Chunking(RTC) 추론 기법 구현: 액션 청크 완료를 기다리지 않고 진행 중인 액션과 새 예측을 연속 블렌딩하여 반응성 향상
Wall-X VLA 정책 추가: Qwen2.5-VL 기반 비전-언어 이해 + 플로우-매칭 액션 예측 결합
X-VLA 정책 추가: Microsoft Florence-2 기반 VLA로 파운데이션 모델 다양성 확대
스트리밍 비디오 인코딩 도입: 에피소드 녹화 사이 대기 시간 제거
EnvHub 기능 추가: Hugging Face Hub에서 시뮬레이션 환경 직접 로드
NVIDIA IsaacLab-Arena 통합 구현
코드베이스 현대화: Python 3.12+ 및 Transformers v5 마이그레이션
SO-100/SO-101 구현 통합: 코드 중복 제거 및 유지보수성 개선
원격 Rerun 시각화 추가: 압축 이미지 지원으로 대역폭 효율적인 스트리밍
PyTorch 버전 상향: NVIDIA Blackwell GPU 지원 추가
문서 버전 관리 시스템 도입: 설치된 릴리스와 일치하는 문서 제공

Impact

200개 이상의 병합된 PR, 50명 이상의 신규 기여자 참여, ICLR 2026 논문 수락

Key Takeaway

로봇 학습 플랫폼의 확장은 하드웨어 생태계 통합, 최신 신경망 정책(자동회귀 VLA, 실시간 청킹), 그리고 개발 환경 현대화가 동시에 진행될 때 가능하다. 또한 커뮤니티 기여 구조(이슈 템플릿, 자동 레이블링, 명확한 기여 가이드)와 문서 버전 관리는 대규모 오픈소스 성장의 필수 요소이다.

실천 포인트

로봇 학습 프레임워크 개발팀에서 새로운 하드웨어 지원을 추가할 때, Real-Time Chunking 같은 추론 최적화 기법과 스트리밍 비디오 인코딩을 함께 도입하면 시뮬레이션 훈련과 실제 하드웨어 배포 간의 지연 격차를 줄일 수 있다. 또한 EnvHub처럼 허브 기반 환경 로드 시스템을 제공하면 연구자들의 재현성과 실험 속도를 대폭 향상시킬 수 있다.

태그

#Open Source #PyTorch #Vision-Language-Action #Real-time Inference #Robotics

원문 읽기