피드로 돌아가기
Dev.toDevOps
원문 읽기
TOML 기반 정규표현식 린터로 AI 코드 스타일 지문 제거
I built a linter that removes AI fingerprints from code
AI 요약
Context
LLM 생성 코드의 정형화된 문체와 문서 구조가 커뮤니티 내에서 AI 작성 여부를 판단하는 증거로 활용되는 상황 발생. 단순 코드 동작 여부보다 작성 경로(Provenance)를 중시하는 환경에서 AI 보조 개발 결과물이 배제되는 병목 지점 존재.
Technical Solution
- Static Analysis 기반의 코드 스캔 및 스타일 수정으로 AI 특유의 지문(Fingerprint) 제거
- TOML 설정 파일 기반의 Recipe 시스템을 도입하여 정규표현식(Regex) 패턴과 대체 텍스트를 매핑한 유연한 확장 구조 설계
- 'Slop vocabulary' 분석을 통해 robust, leverage 등 LLM 빈출 단어를 일반적 개발 용어로 치환하는 로직 구현
- 코드 내부의 과잉 문서화(Over-documentation) 및 정형화된 README 구조를 탐지하여 제거하는 린팅 규칙 적용
- File type scope 설정을 통한 언어별 최적화된 패턴 매칭 및 Severity 단계별 관리 체계 구축
- Cargo install을 통한 배포로 Rust 생태계 기반의 빠른 실행 속도와 이식성 확보
실천 포인트
- LLM 생성 코드의 정형화된 패턴(특정 단어 반복, 과한 주석) 식별 및 제거 - 확장 가능한 린팅 규칙 설계를 위해 설정 파일(TOML, JSON 등)과 실행 로직의 분리 검토 - 코드 리뷰 시 작성 도구보다 구현 결과물의 품질과 검증 여부에 집중하는 문화 조성