Heuristic 기반 필터 스택 구축을 통한 AI Slop 85% 탐지 구현
AI Content Filter: The Practitioner's Playbook for Killing Low-Quality LLM Slop at Scale
AI Content Filter: The Practitioner's Playbook for Killing Low-Quality LLM Slop at Scale
Claude API Limits Refined, Rose Optimizer & BloodshotNet Open-Sourced
Stop Your Local LLM From Going Rogue: Building Ethical AI Guardrails
Transparency Theatre
Implementing 3-Tier Moderation for Telegram Bots
LY Corporation이 전통 ML 모델과 멀티모달 LLM의 하이브리드 구조를 도입해 대규모 이미지 콘텐츠 모더레이션에서 정확도와 처리 속도 간 균형을 달성했다
Como proteger sua IA com Amazon Bedrock Guardrails
Meta’s latest AI improves its terrible content moderation, just a little
AprielGuard: A Guardrail for Safety and Adversarial Robustness in Modern LLM Systems
Welcoming Llama Guard 4 on Hugging Face Hub
컬리가 Prompt Engineering과 Chain-of-Thought 기법으로 비정형 리뷰 데이터 자동 검수 시스템 구축
Ethics and Society Newsletter #3: Ethical Openness at Hugging Face
Ethical Guidelines for developing the Diffusers library