필터된 피드

Hugging Face Blog

행동 검증 기반 Java 프레임워크 마이그레이션 벤치마크 ScarfBench 공개

ScarfBench: Benchmarking AI Agents for Enterprise Java Framework Migration

AI/MLadvanced15 분 소요2일 전

Hugging Face Blog

No Free Lunch 정리를 통한 AI Specialization의 필연성 증명

Why Specialization Is Inevitable

AI/MLadvanced28 분 소요2일 전

Hugging Face Blog

고차원 밀도·스코어 추정을 위한 단일 Transformer 구조, KDE 대비 오차 최대 37배 감소

DiScoFormer: One transformer for density and score, across distributions

AI/MLadvanced10 분 소요3일 전

Hugging Face Blog

단일 명령어로 vLLM 서버 구축 및 OpenAI API 호환 엔드포인트 확보

Run a vLLM Server on HF Jobs in One Command

AI/MLintermediate20 분 소요6일 전

Hugging Face Blog

Hybrid 모델 도입 통한 Content Word 예측 Loss Gap 0.04 달성

Which tokens does a hybrid model predict better?

AI/MLadvanced16 분 소요2026년 6월 25일

Hugging Face Blog

NeMo AutoModel 도입으로 MoE 학습 처리량 3.7배 향상 및 메모리 32% 절감

Accelerating Transformers Fine-Tuning with NVIDIA NeMo AutoModel

AI/MLadvanced28 분 소요2026년 6월 24일

Hugging Face Blog

CUGA 도입을 통한 Agent Plumbing 제거 및 소형 모델 기반 고성능 추론 구현

Build real agentic apps using CUGA: two dozen working examples on a lightweight harness

AI/MLintermediate38 분 소요2026년 6월 23일

Hugging Face Blog

1.5M~34.5M 파라미터 규모별 최적화로 50개 언어 OCR 정밀도 향상

PP\-OCRv6 on Hugging Face: 50\-Language OCR from 1\.5M to 34\.5M Parameters

AI/MLintermediate14 분 소요2026년 6월 22일

Hugging Face Blog

PA-DR RL 학습으로 데이터 유출 34%에서 9.9%로 절감

MosaicLeaks: Can your research agent keep a secret?

AI/MLadvanced23 분 소요2026년 6월 18일

Hugging Face Blog

MolmoMotion-1M 기반 범용 3D Motion Forecasting 모델 구현

MolmoMotion: Language-guided 3D motion forecasting

AI/MLadvanced24 분 소요2026년 6월 17일

Hugging Face Blog

단일 Agent Loop와 통일된 Dataset 포맷으로 Sim-to-Real 간극 제거

From the Hugging Face Hub to robot hardware with Strands Agents and LeRobot

AI/MLadvanced44 분 소요2026년 6월 17일

Hugging Face Blog

IndexShare 도입으로 1M Context 구현 및 per-token FLOPs 2.9배 절감

GLM-5.2: Built for Long-Horizon Tasks

AI/MLadvanced36 분 소요2026년 6월 17일

Hugging Face Blog

OLMES 표준 기반의 체크포인트별 고해상도 LLM 평가 워크벤치 구축

olmo-eval: An evaluation workbench for the model development loop

AI/MLintermediate20 분 소요2026년 6월 12일

Hugging Face Blog

Fused MLP 설계를 통한 HBM 트래픽 제거 및 커널 최적화

Profiling in PyTorch (Part 2): From nn.Linear to a Fused MLP

AI/MLadvanced42 분 소요2026년 6월 11일

Hugging Face Blog

Code-switching 대응 ASR 벤치마크 통한 최적 모델 선정 및 전파 오류 분석

Can Voice Agents Handle Bilingual Customers? Benchmarking Frontier ASR on Code-Switched Speech

AI/MLintermediate33 분 소요2026년 6월 9일

Hugging Face Blog

Gemma 3-12B LoRA 튜닝을 통한 ADHD 맞춤형 Dopamine Sparking 인터페이스 구현

NeuroBait: I fine-tuned a model to spark dopamine for ADHD brain

AI/MLintermediate9 분 소요2026년 6월 9일

Hugging Face Blog

Multi-Model Agent 환경의 불확실성 해결을 위한 Settlement Seam 제어 설계

The crash that vanished: control and emergence in a five-model economy

AI/MLadvanced14 분 소요2026년 6월 8일

Hugging Face Blog

Qwen3.5 4B 모델 최적화를 통한 저비용 고효율 스캠 분석 도구 구현

Building Pakistan Notice Helper: A Small AI Tool for a Very Local Safety Problem

AI/MLintermediate32 분 소요2026년 6월 8일

Hugging Face Blog

Nemotron 30b 기반 Three.js 게임 생성 자동화 시도와 RAG 도입을 통한 컨텍스트 최적화 분석

Amazing Digital Dentures (a failed project)

AI/MLintermediate4 분 소요2026년 6월 7일

Hugging Face Blog

Deterministic Engine과 LLM의 분리를 통한 Claude Code 세션 분석 도구 구현

Her · हेर — a detective for your Claude Code sessions

AI/MLintermediate6 분 소요2026년 6월 7일

전체 피드

행동 검증 기반 Java 프레임워크 마이그레이션 벤치마크 ScarfBench 공개

No Free Lunch 정리를 통한 AI Specialization의 필연성 증명

고차원 밀도·스코어 추정을 위한 단일 Transformer 구조, KDE 대비 오차 최대 37배 감소

단일 명령어로 vLLM 서버 구축 및 OpenAI API 호환 엔드포인트 확보

Hybrid 모델 도입 통한 Content Word 예측 Loss Gap 0.04 달성

NeMo AutoModel 도입으로 MoE 학습 처리량 3.7배 향상 및 메모리 32% 절감

CUGA 도입을 통한 Agent Plumbing 제거 및 소형 모델 기반 고성능 추론 구현

1.5M~34.5M 파라미터 규모별 최적화로 50개 언어 OCR 정밀도 향상

PA-DR RL 학습으로 데이터 유출 34%에서 9.9%로 절감

MolmoMotion-1M 기반 범용 3D Motion Forecasting 모델 구현

단일 Agent Loop와 통일된 Dataset 포맷으로 Sim-to-Real 간극 제거

IndexShare 도입으로 1M Context 구현 및 per-token FLOPs 2.9배 절감

OLMES 표준 기반의 체크포인트별 고해상도 LLM 평가 워크벤치 구축

Fused MLP 설계를 통한 HBM 트래픽 제거 및 커널 최적화

Code-switching 대응 ASR 벤치마크 통한 최적 모델 선정 및 전파 오류 분석

Gemma 3-12B LoRA 튜닝을 통한 ADHD 맞춤형 Dopamine Sparking 인터페이스 구현

Multi-Model Agent 환경의 불확실성 해결을 위한 Settlement Seam 제어 설계

Qwen3.5 4B 모델 최적화를 통한 저비용 고효율 스캠 분석 도구 구현

Nemotron 30b 기반 Three.js 게임 생성 자동화 시도와 RAG 도입을 통한 컨텍스트 최적화 분석

Deterministic Engine과 LLM의 분리를 통한 Claude Code 세션 분석 도구 구현

행동 검증 기반 Java 프레임워크 마이그레이션 벤치마크 ScarfBench 공개

No Free Lunch 정리를 통한 AI Specialization의 필연성 증명

고차원 밀도·스코어 추정을 위한 단일 Transformer 구조, KDE 대비 오차 최대 37배 감소

단일 명령어로 vLLM 서버 구축 및 OpenAI API 호환 엔드포인트 확보

Hybrid 모델 도입 통한 Content Word 예측 Loss Gap 0.04 달성

NeMo AutoModel 도입으로 MoE 학습 처리량 3.7배 향상 및 메모리 32% 절감

CUGA 도입을 통한 Agent Plumbing 제거 및 소형 모델 기반 고성능 추론 구현

1.5M~34.5M 파라미터 규모별 최적화로 50개 언어 OCR 정밀도 향상

PA-DR RL 학습으로 데이터 유출 34%에서 9.9%로 절감

MolmoMotion-1M 기반 범용 3D Motion Forecasting 모델 구현

단일 Agent Loop와 통일된 Dataset 포맷으로 Sim-to-Real 간극 제거

IndexShare 도입으로 1M Context 구현 및 per-token FLOPs 2.9배 절감

OLMES 표준 기반의 체크포인트별 고해상도 LLM 평가 워크벤치 구축

Fused MLP 설계를 통한 HBM 트래픽 제거 및 커널 최적화

Code-switching 대응 ASR 벤치마크 통한 최적 모델 선정 및 전파 오류 분석

Gemma 3-12B LoRA 튜닝을 통한 ADHD 맞춤형 Dopamine Sparking 인터페이스 구현

Multi-Model Agent 환경의 불확실성 해결을 위한 Settlement Seam 제어 설계

Qwen3.5 4B 모델 최적화를 통한 저비용 고효율 스캠 분석 도구 구현

Nemotron 30b 기반 Three.js 게임 생성 자동화 시도와 RAG 도입을 통한 컨텍스트 최적화 분석

Deterministic Engine과 LLM의 분리를 통한 Claude Code 세션 분석 도구 구현