피드로 돌아가기
Hugging Face BlogAI/ML
원문 읽기
LeRobot v0.5.0: Scaling Every Dimension
LeRobot이 200개 이상의 병합된 PR과 50명 이상의 신규 기여자를 통해 Unitree G1 휴머노이드 지원, Pi0-FAST 자동회귀 VLA, Real-Time Chunking 추론 기법 도입으로 로봇 학습 플랫폼을 대폭 확장
AI 요약
Context
LeRobot은 기존에 테이블탑 암(arm) 중심의 제한된 로봇 생태계를 보유하고 있었으며, 추론 지연이 발생하는 기존 정책들로 인해 실시간 배포에 한계가 있었다. 또한 단편화된 하드웨어 지원과 레거시 Python 버전에 따른 최신 에코시스템 호환성 문제가 있었다.
Technical Solution
- Unitree G1 휴머노이드 전신 제어 추가: Locomotion, Manipulation, Teleoperation, Whole-Body Control(WBC)을 단일 통합 인터페이스로 구현
- OpenArm 및 OpenArm Mini 양팔 구성 지원 추가: 쌍팔 조작 작업 가능하도록 양방향 텔레오퍼레이션 장치 통합
- Earth Rover 모바일 로봇, OMX Robot 암, SO-100/SO-101 통합, CAN 버스 기반 RobStride·Damiao 모터 컨트롤러 지원 추가
- Pi0-FAST 자동회귀 VLA 정책 도입: FAST(Frequency-space Action Sequence Tokenization)를 사용한 Gemma 300M 기반 액션 토크나이저로 이산화된 액션 토큰 생성
- Real-Time Chunking(RTC) 추론 기법 구현: 액션 청크 완료를 기다리지 않고 진행 중인 액션과 새 예측을 연속 블렌딩하여 반응성 향상
- Wall-X VLA 정책 추가: Qwen2.5-VL 기반 비전-언어 이해 + 플로우-매칭 액션 예측 결합
- X-VLA 정책 추가: Microsoft Florence-2 기반 VLA로 파운데이션 모델 다양성 확대
- 스트리밍 비디오 인코딩 도입: 에피소드 녹화 사이 대기 시간 제거
- EnvHub 기능 추가: Hugging Face Hub에서 시뮬레이션 환경 직접 로드
- NVIDIA IsaacLab-Arena 통합 구현
- 코드베이스 현대화: Python 3.12+ 및 Transformers v5 마이그레이션
- SO-100/SO-101 구현 통합: 코드 중복 제거 및 유지보수성 개선
- 원격 Rerun 시각화 추가: 압축 이미지 지원으로 대역폭 효율적인 스트리밍
- PyTorch 버전 상향: NVIDIA Blackwell GPU 지원 추가
- 문서 버전 관리 시스템 도입: 설치된 릴리스와 일치하는 문서 제공
Impact
200개 이상의 병합된 PR, 50명 이상의 신규 기여자 참여, ICLR 2026 논문 수락
Key Takeaway
로봇 학습 플랫폼의 확장은 하드웨어 생태계 통합, 최신 신경망 정책(자동회귀 VLA, 실시간 청킹), 그리고 개발 환경 현대화가 동시에 진행될 때 가능하다. 또한 커뮤니티 기여 구조(이슈 템플릿, 자동 레이블링, 명확한 기여 가이드)와 문서 버전 관리는 대규모 오픈소스 성장의 필수 요소이다.
실천 포인트
로봇 학습 프레임워크 개발팀에서 새로운 하드웨어 지원을 추가할 때, Real-Time Chunking 같은 추론 최적화 기법과 스트리밍 비디오 인코딩을 함께 도입하면 시뮬레이션 훈련과 실제 하드웨어 배포 간의 지연 격차를 줄일 수 있다. 또한 EnvHub처럼 허브 기반 환경 로드 시스템을 제공하면 연구자들의 재현성과 실험 속도를 대폭 향상시킬 수 있다.