GeekNewsNatural Language Autoencoders: Claude의 생각을 텍스트로 바꾸기NLA를 통한 LLM 활성값의 자연어 번역 및 내부 사고 가시화AI/MLadvanced14 분 소요5일 전
Dev.toGPT-2 내부 활성화 프로브를 통한 Tool Poisoning 탐지율 98.5% 달성My security scanner scored 0 out of 485. So I looked inside GPT-2's brain instead.Securityadvanced10 분 소요2026년 5월 3일