전체 피드 소스 목록

카테고리

Frontend Backend DevOps AI/ML Mobile Database Security Career Infrastructure

© 2026 DevPick

#adversarial-evaluation

피드 검색 북마크 설정

Dev.to

5종 LLM 대상 Adversarial Eval 수행 결과 최대 정답률 62.5% 기록

I Built an Adversarial Eval Framework and Attacked 5 LLMs — Every Single One Failed

AI/MLadvanced28 분 소요1일 전

Hugging Face Blog

HuggingFace 팀이 LLM의 유해 출력을 유도하는 Red-Teaming 평가 방법론을 체계화해 모델 안전성 검증 체계 수립

Red-Teaming Large Language Models

AI/MLintermediate16 분 소요2023년 2월 24일