피드로 돌아가기
Dev.toSecurity
원문 읽기
27년 된 취약점까지 찾아낸 Claude Mythos의 충격적 보안 성능
Anthropic Just Did Something Unprecedented: They Hid Their Best Security Model
AI 요약
Context
기존 AI 모델은 자율적인 Exploit 개발 성공률이 매우 낮은 한계 존재. 수십 년간 발견되지 않은 OS 및 브라우저의 치명적 취약점들이 여전히 잠재. AI를 통한 자동화된 취약점 탐지와 공격 체인 구성 능력이 보안 생태계의 새로운 위협으로 부상.
Technical Solution
- 고도화된 취약점 탐색 모델인 Claude Mythos 설계
- 4~5개의 취약점을 결합하여 정교한 Exploit Chain을 생성하는 추론 능력 구현
- 브라우저 및 OS Sandbox를 동시에 탈출하는 JIT Heap Spray 작성 기술 적용
- 인간이 수십 년간 놓친 권한 상승(Privilege Escalation) 경로 식별 로직 강화
- 모델 오남용 방지를 위해 검증된 파트너에게만 접근 권한을 부여하는 Project Glasswing 운영 전략
- 인프라 유지보수자에게 패치 시간을 선제적으로 제공하는 Responsible Disclosure 체계 구축
Impact
- Claude Opus 4.6의 0%에 가까운 Exploit 개발 성공률을 Mythos Preview에서 수백 번의 시도 중 181회 성공으로 개선
- OpenBSD 코드베이스 내 27년간 방치된 TCP 패킷 처리 취약점 식별
- Project Glasswing 운영을 위한 1억 달러 규모의 Compute Credit 및 400만 달러 직접 기부 투입
Key Takeaway
AI의 취약점 탐색 및 Exploit 생성 능력이 임계점을 넘어서며 보안 패치 속도가 공격 도구의 보급 속도보다 빨라야 하는 새로운 보안 패러다임 진입.
실천 포인트
AI 기반의 체계적인 코드 감사(Systematic Auditing) 도입을 통해 레거시 코드베이스의 잠재적 취약점을 선제적으로 제거할 것