Show GN: Tenet - 인터뷰부터 DAG 실행, 3중 critic, steer 메시지까지 포함한 장시간 AI 코딩 하네스

3중 Critic 및 DAG 구조로 6시간 이상 무인 실행 가능한 AI 코딩 하네스 구현

jeikei2026년 4월 23일3분advanced

AI 요약

Context

장시간 AI 코딩 작업 시 스펙 소실과 컨텍스트 붕괴로 인한 품질 저하 문제 발생. 기존 세션 기반 에이전트의 휘발성 맥락 관리와 자기 완결적 평가의 한계를 해결하기 위한 구조적 접근 필요.

Interview 및 Spec 정의 단계를 통한 요구사항의 정적 고정 및 검증 Harness 선행 구축
작업을 Dependency Graph로 분해하여 독립적 Job의 병렬 실행을 지원하는 DAG Decomposition 적용
작성자 맥락과 분리된 Fresh Context 기반의 3중 Critic(Code, Test, Playwright e2e) 파이프라인을 통한 상호 검증 강화
실행 중인 루프를 중단하지 않고 방향성을 수정하는 Steer Message 비동기 반영 메커니즘 설계
SQLite WAL 기반의 Persistent State 관리를 통해 세션 단절 시에도 복구가 가능한 상태 유지 구조 채택
.tenet/ 디렉토리 내 의사결정 기록 및 Journaling을 통한 개발 프로세스의 문서화 자동화

실천 포인트

1. AI 생성 결과물을 검증할 때 생성 모델과 분리된 독립적 평가 에이전트를 배치했는가?

2. 복잡한 태스크를 DAG 단위로 쪼개어 병렬 처리 및 개별 Job 단위의 복구 전략을 세웠는가?

3. 실행 중인 AI 프로세스에 실시간으로 제약 조건을 추가할 수 있는 Steer 메커니즘이 존재하는가?

4. 세션 휘발성을 방지하기 위해 SQLite 등 외부 저장소에 상태를 기록하는 Persistent Layer를 갖췄는가?

태그