피드로 돌아가기
44BITS44BITS
Backend

[뉴스] 앤트로픽, 클로드 모델 품질 저하 버그 수정 완료

앤트로픽이 Claude 모델의 서로 다른 두 가지 버그를 수정해 8월 5일~9월 5일 동안 발생한 품질 저하 문제 해결

44bits2025년 9월 9일5intermediate

Context

8월 초부터 9월 초까지 Claude 모델에서 코딩 능력 저하, 응답 형식 파손, 도구 호출 실패 등의 품질 저하가 발생했으며, Reddit와 Zenn 커뮤니티에서 코드 리팩터링 실패, 150KB 파일 수정 시 4KB만 처리, 컨텍스트 윈도우 감소 등의 증상이 보고되었다.

Technical Solution

  • 첫 번째 버그 수정: Claude Sonnet 4.0에서 2025년 8월 5일~9월 4일 동안 소수 요청의 품질 저하를 야기한 버그를 9월 4일에 수정 완료
  • 두 번째 버그 수정: Claude Haiku 3.5와 일부 Sonnet 4.0 요청에 영향을 미친 별개의 버그를 8월 26일~9월 5일 동안 추적해 9월 5일에 수정 완료
  • 인퍼런스 스택 롤백: Claude Opus 4.1과 4.0에서 8월 26일 02:30부터 8월 28일 11:00(KST)까지 약 56시간 동안 인퍼런스 스택 롤아웃으로 인한 지능 저하, 응답 형식 파손, 도구 호출 실패 문제를 롤백으로 해결
  • 영향 범위: claude.ai, console.anthropic.com, api.anthropic.com, Claude Code 등 전사 서비스에 영향을 미친 버그들을 식별 및 격리

Key Takeaway

대규모 LLM 서비스에서 품질 저하는 단일 원인이 아닌 서로 무관한 다중 버그로부터 발생할 수 있으며, 커뮤니티 피드백이 버그 식별 및 격리에 중요한 역할을 한다는 점을 보여준다.


대규모 언어 모델 서비스를 운영하는 엔지니어들은 성능 저하 이슈 발생 시 인퍼런스 스택, 모델 파라미터, API 엔드포인트별로 동시에 여러 버그가 존재할 수 있다고 가정하고 병렬로 근본 원인을 조사해야 하며, 이를 통해 8월 5일부터 9월 5일 이상의 장기간 영향을 방지할 수 있다.

원문 읽기
[뉴스] 앤트로픽, 클로드 모델 품질 저하 버그 수정 완료 | Devpick