피드로 돌아가기
Dev.toAI/ML
원문 읽기
77개 설계 규칙 기반 TDD 자동화로 Autonomous Pass Rate 100% 달성
77 Rules Later: What Graduating Our First Stack Actually Looked Like
AI 요약
Context
Apple Silicon 기반 로컬 AI 코딩 시스템 ForgeFlow에서 반복되는 실패 패턴을 제거하기 위한 체계적 접근 필요. 기존의 느슨한 설계 규칙 적용으로 인해 다중 엔드포인트 구현 시 스코프 혼선 및 일관성 결여 문제가 지속 발생.
Technical Solution
- CL-071 도입을 통한 File Modification Boundary 설정으로 모든 태스크가 신규 파일만 생성하도록 강제하여 사이드 이펙트 차단
- 'One Endpoint, One File, One Task' 원칙의 절대적 적용을 통한 모델의 구현 범위 명확화 및 스코프 누락 방지
- CL-072 기반의 Required Imports 블록 명시를 통해 모델의 임포트 경로 추측으로 인한 런타임 에러 제거
- Python Decimal 타입 특성을 반영한 CL-076 설계로 Numeric 컬럼의 부동 소수점 비교 오류 해결
- Failure Catalog(FC)와 Crystallized Lesson(CL)으로 이어지는 피드백 루프를 구축하여 실패 패턴의 규칙화 및 자가 회복력 강화
Impact
- Project 17(Blog API) 기준 14개 태스크 전체 33개 테스트 케이스 100% 통과
- 인간 개입 없는 완전 자율 구현 시간 약 12분 소요
- First-run pass rate 85% 이상의 Graduation Criteria 달성
실천 포인트
- AI 에이전트 작업 단위 설계 시 '하나의 파일에 하나의 책임'을 강제하는 엄격한 Boundary 설정 검토 - 모델의 추측 가능성을 제거하기 위해 필요한 모든 의존성(Import)을 프롬프트 수준에서 명시적으로 제공 - 도메인 특화 데이터 타입(Decimal 등) 사용 시 단순 값 비교가 아닌 타입 일치 여부를 검증하는 테스트 규칙 수립 - 반복되는 실패 패턴을 단순 수정하지 않고, 이를 테스트 가능한 설계 규칙(CL)으로 문서화하여 시스템에 내재화