GeekNewsDeepSeek-V4-Flash로 LLM 조향(Steering)이 다시 흥미로워졌다추론 시점 Activation Steering 통한 모델 거부 제거 및 57.07 t/s 성능 달성AI/MLadvanced8 분 소요2026년 5월 17일
Hacker NewsPretrain 단계의 'Flinch' 현상 발견 및 모델별 확률 억제 지표 정량화Even 'uncensored' models can't say what they wantAI/MLadvanced26 분 소요2026년 4월 20일