피드로 돌아가기
GeekNewsAI/ML
원문 읽기
Code as Agent Harness — 코드를 에이전트의 실행 기반으로 보는 102페이지 서베이
Code as Agent Harness 기반의 3계층 에이전트 제어 아키텍처 제안
AI 요약
Context
LLM 생성 코드를 단순 결과물로 취급하여 발생하는 상태 관리 부재와 불완전한 검증 체계의 한계 분석. 에이전트의 추론과 행동을 지속시키는 Operational Substrate로서의 코드 기반 환경 필요성 대두.
Technical Solution
- Harness Interface를 통한 추론의 Externalization 및 실행 환경의 코드베이스 기반 추상화 설계
- Planning을 파일시스템 기반의 지속 계획으로 진화시켜 단순 Decomposition의 한계를 극복한 Harness Mechanisms 구축
- Memory 계층을 단일 VectorDB에서 통합 상태 관리 계층으로 재정의하여 Context Compaction 및 State Offloading 구현
- Plan-Execute-Verify(PEV) 루프에 Read-only부터 Full-access까지 단계별 권한 모델을 적용한 Cybernetic Governor 설계
- 결정적 센서(Linter, Type Checker, Test)를 활용하여 LLM Critique의 불확실성을 제거한 피드백 루프 구성
- 공유 상태 표현의 최적화를 통해 시스템 토폴로지 복잡성을 제거한 Multi-agent 협업 구조 설계
실천 포인트
1. 컨텍스트 윈도우 과부하 방지를 위해 결정 필요 요약본만 유지하고 전체 데이터는 MCP-style 프로토콜로 Offload 했는가
2. LLM의 자체 평가 대신 린터나 타입 체커 같은 결정적 피드백을 제어 신호로 우선 활용하고 있는가
3. 에이전트 실패 원인을 모델 성능이 아닌 저장소 컨텍스트, 도구 인터페이스, 재시도 정책 등 Harness 관점에서 분석했는가
4. Multi-agent 환경에서 공유 상태의 트랜잭션 처리 및 충돌 해결 방안이 설계에 반영되었는가