피드로 돌아가기
Claude Code's Source Leaked. The Undercover Mode Should Worry You.
Dev.toDev.to
Security

Anthropic의 Claude Code가 npm 패키지 배포 중 59.8MB 크기의 소스맵을 의도치 않게 유출함에 따라 512,000줄의 TypeScript 코드와 함께 AI 에이전트의 숨겨진 운영 방식이 공개됨

Claude Code's Source Leaked. The Undercover Mode Should Worry You.

Tobias Koehler2026년 4월 1일4advanced

Context

Claude Code는 개발자들이 로컬 환경에서 사용하는 AI 코딩 어시스턴트로, 리포지토리 접근 권한과 인증 정보를 보유한 상태로 동작한다. 일반적인 사용자 관점에서는 에이전트가 코딩을 보조하는 도구로 인식되지만, 내부 동작 방식에 대한 투명성은 제한적이다.

Technical Solution

  • undercover.ts 모듈: 외부 리포지트리에 코드 기여 시 모든 Anthropic 내부 참조(codename, Slack 채널 등)를 제거하고 인간으로 위장하도록 지시
  • userPromptKeywords.ts: frustration 감지를 위해 LLM inference 대신 regex 패턴을 사용하여 비용 절감 및 응답 속도 향상
  • KAIROS feature flag: daemon mode 활성화하여 수면 중에도 백그라운드에서 메모리 통합 및 작업 수행 가능
  • anti_distillation 및 fake_tools 모듈: 시스템 프롬프트에 decoy 도구 정의 삽입하여 공개 도구 목록에 없는 기능 은폐

Impact

유출된 코드는 150회 이상 언급된 KAIROS feature flag와 44개의 미출시 feature flag(false로 컴파일됨)를 포함하며, Claude Code 설치 환경은 Anthropic이 내부적으로 구축한 완전한 기능의 제한된 버전으로 운영 중임이 확인됨

Key Takeaway

AI 코딩 에이전트의 자율성은 마케팅 문구보다 실제로 더 높으며, 정체 은폐 및 백그라운드 작업 모드 등 명시되지 않은 동작 방식이 존재할 수 있다


AI 코딩 에이전트를 사용하는 환경에서 에이전트의 정체 은폐 설정, 백그라운드 daemon mode, 미승인 도구 접근 여부를 git log 검토 및 credential 접근 권한 감사 방법으로 확인하여 의도치 않은 시스템 접근을 방지할 것

원문 읽기