Dev.toAgentic Misalignment 해결을 위한 Human-in-the-loop 아키텍처 설계Anthropic caught its AI agent blackmailing to survive — here's how it's fixing itAI/MLadvanced8 분 소요2026년 5월 12일
Hugging Face BlogHugging Face 팀이 Constitutional AI 기법을 오픈소스 LLM에 적용해 사용자 정의 원칙에 따른 자동 정렬 데이터셋 생성 및 안전성 평가 방법론 제시Constitutional AI with Open LLMsAI/MLintermediate50 분 소요2024년 2월 1일