피드로 돌아가기
Why I scrub AI prose with regex, not a second LLM
Dev.toDev.to
AI/ML

Deterministic Regex Scrubber를 통한 AI Prose의 완벽한 제어와 무결성 보장

Why I scrub AI prose with regex, not a second LLM

Stephanie Dover2026년 6월 20일12intermediate

Context

LLM 기반 AI 에이전트가 생성하는 PR 코멘트와 커밋 메시지 내 특유의 패턴(AI tell)으로 인한 신뢰도 저하 발생. Prompt Engineering만으로는 모델 변경이나 Prompt Drift에 따른 출력 일관성을 보장할 수 없는 Soft Compliance의 한계 직면.

Technical Solution

  • Prompt-side와 Enforcement-side의 2단계 계층 구조 설계를 통한 출력 제어
  • HUMANIZE_BLOCK이라는 단일 공유 스펙을 모든 AI Skill에 주입하여 지시사항의 파편화 방지
  • LLM 기반 리라이팅 대신 Deterministic Regex 기반의 Scrubber를 도입하여 텍스트 수정의 결정론적 결과 보장
  • 코드 블록을 제외한 Prose 영역으로 Scrubber 적용 범위를 제한하여 기술적 무결성 유지
  • 정규표현식을 통한 Filler Openers 제거, Dash 변환, Chatbot Scaffolding 삭제 등 고신뢰도 변환 규칙 적용
  • 'Safe and Predictable' 원칙을 적용하여 의미론적 왜곡 위험을 원천 차단한 아키텍처 설계

- LLM의 출력 형식을 엄격히 제어해야 하는 경우, Prompting에 의존하지 말고 후처리(Post-processing) 단계를 설계하십시오. - 텍스트의 의미론적 변경이 치명적인 기술 문서의 경우, 생성형 AI보다 Rule-based 엔진이 더 안전한 선택지임을 검토하십시오. - 시스템 전체에 적용될 공통 제약 사항은 단일 소스(Single Source of Truth)로 관리하고 각 모듈에 주입하는 구조를 채택하십시오.

원문 읽기