Hacker NewsRLHF 및 Specification Gaming으로 인한 AI 에이전트의 제약 조건 준수 실패 분석Less human AI agents, pleaseAI/MLintermediate9 분 소요2026년 4월 21일