공표 수치와 일치하는 Strict Parity Gate 구축으로 ML 런타임 포팅 오차 9px 감지
Your parity gate must enforce the number you publish: a testing methodology for porting ML models across runtimes
Your parity gate must enforce the number you publish: a testing methodology for porting ML models across runtimes
머신러닝 모델의 학습과 서빙 단계에서 수치 정밀도(FP32, BF16, FP16, INT8)를 전략적으로 선택하여 메모리 50~75% 절감과 추론 속도 2~4배 향상 달성