피드로 돌아가기
Claude Fable 5/Mythos 5 공개, Anthropic의 5세대 프런티어 모델
GeekNewsGeekNews
AI/ML

Claude Fable 5/Mythos 5 공개, Anthropic의 5세대 프런티어 모델

SWE-Bench Pro 80.3% 달성 및 장기 자율 작업 최적화 5세대 프런티어 모델 공개

boradi2026년 6월 10일4advanced

Context

기존 LLM의 단기 컨텍스트 처리 한계와 복잡한 다단계 작업 수행 시 발생하는 추론 능력 저하를 해결해야 하는 상황. 특히 며칠 단위의 비동기 작업 및 대규모 코드베이스 마이그레이션과 같은 High-effort 작업에서의 안정적인 성능 확보가 요구됨.

Technical Solution

  • 장기 비동기 작업 수행을 위한 Agentic Workflow 최적화를 통한 자율 계획 수립 및 서브에이전트 위임 구조 설계
  • 파일 기반 지속 메모리(Persistent Memory) 도입을 통한 장기 세션 내 정보 유지 및 추론 일관성 확보
  • Vision 모델의 최소 하니스(Minimum Harness) 설계를 통한 인터페이스 의존성 제거 및 환경 직접 상호작용 능력 강화
  • Safety Classifier 기반의 계층적 Fallback 메커니즘을 구축하여 고위험 영역 요청 시 하위 모델(Opus 4.8)로의 자동 우회 처리
  • 안전장치 적용 수준에 따른 모델 티어 분리(Fable 5/Mythos 5)를 통한 유연한 Risk Management 전략 채택

Impact

  • SWE-Bench Pro 80.3% 기록으로 기존 Opus 4.8(69.2%) 및 GPT 5.5(58.6%) 대비 압도적 코딩 성능 입증
  • 5천만 라인 규모 Ruby 코드베이스 마이그레이션을 수개월 분량에서 1일로 단축
  • 지속 메모리 적용 시 Slay the Spire 작업 성능 및 최종장 도달 빈도 3배 향상
  • 단백질 설계 프로세스 10배 가속 및 14개 타깃 중 9개 유력 후보 확보
  • 입력 100만 토큰당 10달러, 출력 50달러로 이전 Preview 버전 대비 비용 50% 이상 절감

Key Takeaway

단순 파라미터 증량보다 자율적 계획 수립, 메모리 지속성, 정교한 Safety Fallback 설계가 결합될 때 실제 엔지니어링 난이도가 높은 Long-term Task 해결이 가능함을 시사함.


- 복잡한 워크플로우 설계 시 전체 작업을 원자 단위로 쪼개어 서브에이전트에게 위임하는 계층 구조 검토 - LLM 기반 에이전트 구현 시 단순 Prompting을 넘어 파일 기반의 Persistent Memory 계층 도입 고려 - 모델의 안전성과 성능 사이의 Trade-off 해결을 위해 도메인별 Fallback 모델 우회 경로 설계 적용

원문 읽기