피드로 돌아가기
Dev.toAI/ML
원문 읽기
Anthropic이 Claude Code에 분류기 모델을 도입해 권한 승인 요청을 45분 세션당 87회에서 거의 0회로 제거
Claude Code Auto Mode: No More Pressing Y
AI 요약
Context
Claude Code는 모든 도구 호출에 대해 수동 승인을 요구했다. 파일 읽기, 코드 검색, git 상태 확인 등 단순 작업도 매번 'y'를 입력해야 했으며, 45분 세션에서 평균 30초마다 한 번씩 약 87회의 승인을 눌러야 했다. 이러한 승인 루프의 불편함으로 많은 개발자들이 모든 안전 검사를 우회하는 --dangerously-skip-permissions 플래그를 사용하게 되었다.
Technical Solution
- 분류기 모델 도입: Claude Sonnet 4.6 기반의 독립 분류기가 모든 도구 호출을 실시간으로 검토해 안전한 작업은 자동 승인, 위험한 작업은 차단
- 3가지 판단 기준 적용: 사용자 요청 범위 내 작업인지, 신뢰할 수 있는 인프라인지, 파일이나 웹페이지에 임베드된 악의적 콘텐츠에 의해 구동되는지 여부 검토
- 분류기 성능 최적화: 주 세션 모델(Opus 4.6)과 관계없이 항상 Sonnet 4.6을 사용해 모든 도구 호출마다 빠르고 비용 효율적인 분류 수행
- 안전한 작업 자동 실행: 파일 읽기, 코드 검색, git log, git diff 등 읽기 전용 작업과 사용자 의도에 부합하는 파일 쓰기 작업은 즉시 실행
- 위험한 작업 차단 및 우회: 대량 파일 삭제, rm -rf 패턴, 외부 네트워크 요청, .env 파일 접근, git push --force, 프로덕션 인프라 영향 작업 차단 후 Claude가 안전한 대체 경로 자동 제시
Impact
- 권한 승인 프롬프트: 45분 세션당 87회에서 0회 수준으로 감소
- 도구 호출당 레이턴시 오버헤드: 분류 프로세스로 인해 약 200~400ms 증가
- 사용 범위: Team 플랜에서 연구 프리뷰로 현재 제공, Enterprise와 API 접근은 향후 지원 예정
Key Takeaway
분류기 모델이 정적 규칙 목록 대신 사용자 의도를 기반으로 문맥 인식형 판단을 내릴 때, 개발자가 불편한 보안 메커니즘을 우회하려는 유혹을 크게 줄일 수 있다. 초당 30회의 사소한 마찰이 위험한 우회 방법 채택으로 이어지는 것을 방지하려면, 자동화된 중간 계층이 개발 속도와 보안을 동시에 만족시켜야 한다.
실천 포인트
AI 기반 코드 작성 도구를 개발하는 팀에서 권한 관리를 Sonnet 급의 빠른 분류기 모델로 구현하면, 매 작업마다 사용자 개입을 요구하는 대신 사용자 의도 범위 내에서 자동 실행하는 방식으로 전환할 수 있다. 이를 통해 사용자가 보안을 무시하고 위험한 플래그를 사용할 동기를 제거하면서도, 분류기의 판단 오류를 격리된 환경에서 격리시켜 피해를 제한할 수 있다.