장기 실행 에이전트 - 에이전트가 며칠 동안 실행되면 무엇이 달라지는가

Brain/Hands/Session 분리 구조를 통한 다일(Multi-day) 자율 에이전트 아키텍처 구현

neo2026년 5월 4일14분advanced

AI 요약

Context

단일 채팅 세션 기반 에이전트는 Context Window 소진 및 Context Rot으로 인한 성능 저하 문제 발생. 특히 자기 검증 부재로 인한 긍정 편향과 영속 상태 관리 체계 미비로 인해 장기 실행 시 작업 일관성 유지에 한계 노출.

Technical Solution

Brain/Hands/Session 분리: 추론 루프(Brain), 격리된 실행 샌드박스(Hands), 추가 전용 이벤트 로그(Session)를 분리하여 하네스 무상태화 및 복구 가능성 확보
Planner-Worker-Judge 삼중 구조: 작업 계획, 독립적 실행, 완료 판정을 분리하여 모델의 자기 채점 편향을 제거하고 객관적 검증 체계 구축
File-system 기반 상태 영속화: prd.json(계획), progress.txt(로그), AGENTS.md(룰북) 등 구조화된 파일로 기억을 외재화하여 모델의 기억상실 문제 해결
Context Reset 및 구조화된 Handoff: 단순 요약 대신 세션을 해체하고 핸드오프 파일로 상태를 재구성하는 리셋 메커니즘을 통해 Alignment Drift 방지
Cloud Sandbox 전환: 로컬 실행 시간을 판단하여 30분 이상 소요 시 클라우드 인프라로 작업을 이관하고 Git Worktree 기반으로 격리 운영

실천 포인트

- 생성자와 평가자(Judge)를 서로 다른 프롬프트 또는 모델로 분리했는가 - 모든 도구 호출과 관찰 결과가 Append-only 로그로 영속화되어 복구가 가능한가 - 에이전트 시작 전 테스트 가능한 명시적 완료 조건을 외부 파일에 정의했는가 - 샌드박스 환경에서 API 키 등 민감 권한이 분리되어 보안 공격 표면을 최소화했는가 - 예산 소진 방지를 위한 서킷 브레이커 및 지출 하드캡을 설정했는가

태그

#Long-running Agent #Sandboxing #Context Rot #Alignment Drift #Event Sourcing

원문 읽기