Dev.toSlowFast Network 도입을 통한 비디오 시간 예측 오차 30s에서 1-2s로 단축I Spent 6 Months Trying to See Time in Videos. Here's What Finally Worked.AI/MLintermediate8 분 소요1일 전
Hugging Face BlogHugging Face가 256M~2.2B 파라미터의 SmolVLM2 모델 3종을 출시해 스마트폰부터 서버까지 모든 기기에서 비디오 이해 기능 실행 가능SmolVLM2: Bringing Video Understanding to Every DeviceAI/MLintermediate24 분 소요2025년 2월 20일