피드로 돌아가기
GeekNewsAI/ML
원문 읽기
Show GN: Tenet - 인터뷰부터 DAG 실행, 3중 critic, steer 메시지까지 포함한 장시간 AI 코딩 하네스
3중 Critic 및 DAG 구조로 6시간 이상 무인 실행 가능한 AI 코딩 하네스 구현
AI 요약
Context
장시간 AI 코딩 작업 시 스펙 소실과 컨텍스트 붕괴로 인한 품질 저하 문제 발생. 기존 세션 기반 에이전트의 휘발성 맥락 관리와 자기 완결적 평가의 한계를 해결하기 위한 구조적 접근 필요.
Technical Solution
- Interview 및 Spec 정의 단계를 통한 요구사항의 정적 고정 및 검증 Harness 선행 구축
- 작업을 Dependency Graph로 분해하여 독립적 Job의 병렬 실행을 지원하는 DAG Decomposition 적용
- 작성자 맥락과 분리된 Fresh Context 기반의 3중 Critic(Code, Test, Playwright e2e) 파이프라인을 통한 상호 검증 강화
- 실행 중인 루프를 중단하지 않고 방향성을 수정하는 Steer Message 비동기 반영 메커니즘 설계
- SQLite WAL 기반의 Persistent State 관리를 통해 세션 단절 시에도 복구가 가능한 상태 유지 구조 채택
- .tenet/ 디렉토리 내 의사결정 기록 및 Journaling을 통한 개발 프로세스의 문서화 자동화
실천 포인트
1. AI 생성 결과물을 검증할 때 생성 모델과 분리된 독립적 평가 에이전트를 배치했는가?
2. 복잡한 태스크를 DAG 단위로 쪼개어 병렬 처리 및 개별 Job 단위의 복구 전략을 세웠는가?
3. 실행 중인 AI 프로세스에 실시간으로 제약 조건을 추가할 수 있는 Steer 메커니즘이 존재하는가?
4. 세션 휘발성을 방지하기 위해 SQLite 등 외부 저장소에 상태를 기록하는 Persistent Layer를 갖췄는가?