GeekNewsAnthropic, “Alibaba가 Claude AI 모델 역량을 불법 추출했다”2.8천만 건의 API 교환을 통한 Claude 모델 역량 Distillation 시도 포착AI/MLadvanced18 분 소요2026년 6월 25일
Dev.toRLAIF의 비용 효율성과 Human Feedback의 도메인 전문성 결합을 통한 하이브리드 정렬 설계RLAIF Is Eating RLHF — Here Are the Four Places Human Feedback Still WinsAI/MLadvanced18 분 소요2026년 6월 16일