Moebius: 0.2B 이미지 인페인팅 모델로 10B급 성능 달성

0.22B 파라미터로 10B급 성능 구현 및 추론 속도 15배 가속

neo2026년 6월 24일10분advanced

AI 요약

Context

10B 규모의 거대 파운데이션 모델 기반 인페인팅은 고품질 결과를 보장하나 막대한 연산 비용으로 인해 엣지 디바이스 배포에 제약 발생. 단순한 구조 압축은 표현 병목(representation bottleneck)을 유발하여 이미지 품질을 저하시키는 기술적 한계 존재.

Technical Solution

LλMI Block 도입을 통한 Self-attention 및 Cross-attention 재구성으로 공간 맥락과 전역 의미 정보를 고정 크기 선형 행렬로 압축
Quadratic 연산 복잡도를 회피하여 연산 효율성을 극대화한 아키텍처 설계
적응형 다중 입자도 Distillation 전략을 통해 Teacher 모델의 표현력을 Latent space 내에서 직접 전이
Gradient norm 기반의 적응형 손실 가중 메커니즘으로 미시적 특징과 거시적 Diffusion 궤적 간의 학습 균형 최적화
아키텍처 압축률과 Distillation 효율 사이의 상호 제약을 분석하여 표현 포화 없는 최적 시너지 지점 도출
LDM 프레임워크에 Latent Categories Guidance(LCG)를 결합하여 작업 특화 전문가 모델(Task-specific Specialist) 구조 확립

실천 포인트

1. 모델 경량화 시 단순 파라미터 제거 대신 선형 행렬 압축 등 연산 복잡도를 낮추는 구조적 재설계 검토

2. Pixel-space의 무거운 디코딩을 피하기 위해 Latent space 내에서 직접 특징을 전이하는 Distillation 파이프라인 구축

3. 고정된 가중치 대신 Gradient norm 기반의 적응형 손실 함수를 적용해 학습 안정성 확보

4. 엣지 배포 목적이라면 ONNX 변환 및 정밀도 최적화(FP16 등) 가능 여부를 초기 설계 단계에서 검증

태그

#Latent Diffusion Model #Model Compression #Inpainting #Knowledge Distillation #Inference Optimization

원문 읽기