Dev.to데이터 표면 의미를 넘어선 Hidden Channel을 통한 모델 행동 특성 전이 발견Subliminal Learning and the Hidden Channel Problem in LLM TrainingAI/MLadvanced6 분 소요18시간 전
The RegisterDistillation 과정의 Subliminal Learning으로 인한 편향 전이 확인(선호도 12%→60% 증가)Bad teacher bots can leave hidden marks on model studentsAI/MLadvanced5 분 소요1일 전