피드로 돌아가기
Ten CLAUDE.md rules for Claude Code - four edit-time, six runtime
Dev.toDev.to
AI/ML

LLM Runtime 제어를 통한 비용 예측 가능성 및 시스템 결정론 확보

Ten CLAUDE.md rules for Claude Code - four edit-time, six runtime

Rene Zander2026년 4월 23일4intermediate

Context

LLM 기반 파이프라인의 프로덕션 적용 시 발생하는 비결정적 출력, 무분별한 토큰 비용 발생, 예기치 못한 Side-effect 등의 런타임 실패 모드 분석. 단순 코드 생성 규칙을 넘어 실행 단계에서의 안정성과 보안을 확보하기 위한 가드레일 설계 필요성 대두.

Technical Solution

  • Deterministic First 원칙을 통한 판단 영역(LLM)과 실행 영역(Plain Code)의 엄격한 분리 설계
  • Config 기반의 3단계 Token Budget(Step, Pipeline, Day) 설정을 통한 비용 오버런 즉시 차단 및 Halt 메커니즘 구현
  • Destructive Action 수행 전 Human-In-The-Loop(HITL) 단계를 필수 Step으로 정의하여 승인 기반의 외부 시스템 연동 구조 구축
  • Output Schema 강제를 통한 LLM 응답의 정형화 및 스키마 불일치 시 Retry 또는 Halt 처리를 통한 하위 로직의 안정성 확보
  • Prompt Injection 방지를 위한 시스템 마커 제거 및 입력값 정규화 프로세스 도입
  • 공격자에게 힌트를 제공하지 않는 내부 로그 중심의 Silent Rejection 전략 채택

- LLM에 라우팅이나 리트라이 결정권을 부여하는 대신 상태 코드 기반의 결정론적 코드 작성 여부 확인 - 프롬프트 내부가 아닌 외부 설정 파일에 토큰 예산 한도를 정의하고 강제 종료 로직 구현 - 외부 시스템에 영향을 주는 모든 API 호출 앞에 명시적인 승인 단계(Approval Step) 배치 - LLM 응답을 받는 즉시 JSON Schema 검증을 수행하여 타입 불일치로 인한 런타임 에러 방지

원문 읽기