Public LLM 기반 Agentic Workflow를 통한 Mythos 취약점 재현 및 보안 패러다임 전환

We Reproduced Anthropic's Mythos Findings with Public Models

2026년 4월 17일15분advanced

AI 요약

Context

Anthropic의 Mythos 및 Project Glasswing은 고도화된 AI 취약점 연구 역량이 특정 폐쇄적 환경에서만 가능함을 주장함. 그러나 실제로는 Public Model의 성능 향상으로 인해 모델 접근성보다 이를 운영하는 Workflow의 설계 능력이 더 중요한 시점에 도달함.

Technical Solution

Open-source coding agent인 opencode를 활용한 Public API 기반의 재현 환경 구축
Planning step을 통한 대상 파일의 분석 계획 수립 및 최적의 Chunking 전략 자동 생성
Detection step에서 생성된 Chunk 단위로 개별 Detection Agent를 할당하여 병렬 분석 수행
분석 Agent가 전체 Repository 파일을 참조하여 가설을 검증하는 상호 참조 로직 적용
모델의 One-shot 생성 한계를 극복하기 위해 도구 활용, 재시도, 검증이 결합된 Agentic Search Process 설계
Second-pass Reviewer를 도입하여 Low-value findings를 필터링하는 2단계 검증 구조 채택

실천 포인트

1. 단순 프롬프팅 대신 Planning-Detection-Review로 이어지는 Multi-step Agentic Workflow 도입 검토

2. 대규모 코드베이스 분석 시 모델의 Context Window 한계를 극복하기 위한 자동화된 Chunking 전략 수립

3. AI 생성 결과물의 신뢰도 확보를 위해 독립적인 Reviewer Agent를 통한 교차 검증 단계 추가

4. 모델 성능 의존도를 낮추고 결과물을 실제 패치로 연결하는 Operationalization 프로세스 구축

태그

#SSDLC #Vulnerability Research #Open-source Agent #LLM #Agentic Workflow

원문 읽기