#hardware-acceleration 아티클 모음

GeekNews

중국 딥시크, V4-Pro API 75% 영구 가격 인하 단행

V4-Pro API 비용 75% 인하를 통한 AI 추론 시장 파괴

AI/MLintermediate3 분 소요12시간 전

Dev.to

RAM 25MB의 초경량 설계와 Auto-detected GPU Transcoding 구현

ShareBox v5 — GPU transcoding, Netflix-style grid, and why I don't need Plex anymore

Infrastructureintermediate8 분 소요1일 전

Dev.to

Vulkan 기반 ggml 엔진 도입을 통한 RX 580 AI 가속 4.5배 달성

Three researchers. One GPU. Two years. How the RX 580 became an AI platform.

AI/MLintermediate7 분 소요2일 전

Hacker News

80386 Microcode 분석을 통한 94,720-bit 블랙박스 구조 해독 및 보안 취약점 발견

80386 Microcode Disassembled

Infrastructureadvanced15 분 소요3일 전

Dev.to

Whisper AI 기반 Local-first 환경의 크로스 플랫폼 자막 생성 시스템 구축

I built Voice2Sub: a local AI subtitle generator for video and audio

AI/MLintermediate7 분 소요5일 전

GeekNews

vLLM Recipes 개편 - 모델+하드웨어 조합별 설정을 딸각 한방으로

모델-하드웨어 최적 조합 자동화를 위한 vLLM Recipes 아키텍처 개편

AI/MLintermediate1 분 소요2026년 4월 23일

GeekNews

Google LiteRT-LM - 엣지 디바이스용 고성능 LLM 추론 프레임워크

GPU/NPU 하드웨어 가속 기반의 범용 온디바이스 LLM 추론 엔진 LiteRT-LM

AI/MLintermediate2 분 소요2026년 4월 22일

Dev.to

Zero-JS 기반 GPU 가속 SVG 애니메이션 구현을 통한 런타임 오버헤드 제거

CSS Transform Animations on SVG: Scale, Rotate, Translate

Frontendbeginner6 분 소요2026년 4월 11일

The Register

3.5GW 규모 Google TPU 도입, Anthropic의 초거대 AI 인프라 전략

Anthropic reveals $30bn run rate and plans to use 3.5GW of new Google AI chips

Infrastructureadvanced5 분 소요2026년 4월 7일

Dev.to

3.4억 행 데이터 스캔, GPU 가속으로 달성하는 분석 성능 최적화

What do you want to know about hardware acceleration? Ask the Google team!

Infrastructureintermediate1 분 소요2026년 4월 3일

Hugging Face Blog

Habana Gaudi2에서 BridgeTower 비전-언어 모델 파인튜닝 시 데이터 로딩 최적화로 Nvidia A100 대비 2.5배, H100 대비 1.4배 속도 향상

Accelerating Vision-Language Models: BridgeTower on Habana Gaudi2

AI/MLintermediate27 분 소요2023년 6월 29일

Hugging Face Blog

Hugging Face와 AWS가 Transformer 모델을 AWS Inferentia2에 최적화하여 NVIDIA A10G GPU 대비 4.5배 낮은 레이턴시 달성

Accelerating Hugging Face Transformers with AWS Inferentia2

Backendintermediate14 분 소요2023년 4월 17일

Hugging Face Blog

Habana Labs가 Gaudi2 가속기와 Optimum Habana 라이브러리를 통해 176억 파라미터 BLOOMZ 모델의 추론 지연시간을 Nvidia A100 80GB 대비 1.42배 단축

Fast Inference on Large Language Models: BLOOMZ on Habana Gaudi2 Accelerator

AI/MLintermediate26 분 소요2023년 3월 28일

Hugging Face Blog

Intel과 Hugging Face가 Optimum Intel 라이브러리를 통해 DistilBERT 모델을 양자화해 평가 속도를 1.34배 향상

Intel and Hugging Face Partner to Democratize Machine Learning Hardware Acceleration

AI/MLintermediate23 분 소요2022년 6월 15일

Hugging Face Blog

Habana Labs와 Hugging Face가 SynapseAI를 Optimum 라이브러리와 통합해 Transformer 모델 학습 비용을 40% 단축

Habana Labs and Hugging Face Partner to Accelerate Transformer Model Training

AI/MLintermediate6 분 소요2022년 4월 12일