피드로 돌아가기
Claude Code Got 67% Dumber. AMD's AI Director Had the Telemetry to Prove It.
Dev.toDev.to
AI/ML

Claude Code 추론 능력 67% 하락, 텔레메트리로 증명한 AI 성능 저하

Claude Code Got 67% Dumber. AMD's AI Director Had the Telemetry to Prove It.

Aditya Agarwal2026년 4월 7일3intermediate

Context

AI 코딩 도구의 추론 깊이가 예고 없이 하락하는 성능 저하 현상 발생. 사용자가 체감하는 정성적 품질 저하를 정량적으로 측정할 수 있는 관찰 체계 부재. 도구의 성능 변화를 독립적으로 검증할 수 없는 신뢰성 문제 직면.

Technical Solution

  • 6,852개 세션과 234,760개 Tool Call 데이터를 수집하여 성능 변화를 추적하는 Telemetry 시스템 구축
  • 파일 편집 전 읽기 수행 비율(File-read rate)을 측정하여 모델의 사고 깊이를 정량화하는 분석 방식 도입
  • Adaptive Thinking 메커니즘 및 기본 사고 수준(Thinking level) 설정 변경에 따른 성능 상관관계 분석
  • 세션 노트 검토 및 가지치기를 통해 메모리를 최적화하는 Dream 모드 로직 식별
  • 공개 저장소 기여 시 AI 정체성을 숨기는 Undercover 모드 설계 구조 확인

Impact

  • Thinking depth 67% 감소
  • 파일 편집 전 읽기 습관 70% 이상 하락
  • 내부 소스 코드 약 500,000라인 유출
  • 저작권 침해 대응을 위한 8,000건의 Takedown 요청 발생

Key Takeaway

블랙박스 형태의 AI 서비스에 의존하는 워크플로우는 위험하며, 도구의 성능을 지속적으로 모니터링하고 검증할 수 있는 자체 instrumentation 체계 확보가 필수적임.


AI 도구 도입 시 단순 체감이 아닌, 핵심 작업 성공률과 API 호출 패턴을 기록하는 전용 대시보드를 구축하여 성능 저하를 감지할 것

원문 읽기
Claude Code Got 67% Dumber. AMD's AI Director Had the Telemetry to Prove It. | Devpick