피드로 돌아가기
Dev.toAI/ML
원문 읽기
LLM의 불안정한 자율성을 'Harness Engineering'으로 제어하는 오토노머스 에이전트 프레임워크
HarnessOS: scaffold/middleware for infinite autonomous tasks — built on Harness Engineering
AI 요약
Context
기존 에이전트 프레임워크는 단일 세션 내 완료 중심 설계로, 컨텍스트 70% 지점에서 급격한 성능 저하(클리프-엣지)가 발생한다. 목표 달성 후 다음 개선 방향을 탐색하는 메커니즘이 부재하며, 실패 분류 없이 예외 처리만 수행한다.
Technical Solution
- omc-live → 2-Wave 전략(전략 자문 + 실행 루프)과 자기 진화 목표를 결합한 유한 반복 구조 구현
- omc-live-infinite → 컨텍스트 70% 임계점에서 상태 저장 후 세션 전환, 세계 모델로 에피스토믹 상태 유지
- CTX → 쿼리 분류(4종 전략: 직접 조회, 임베딩 검색, 의존성 그래프, Git 변경 이력)로 R@5=1.0 달성
- omc-failure-router → 실패를 과제 분해 오류, 역할 비준수, 경계 침범 3가지로 분류 후 라우팅
Impact
가설 주도 디버깅은 엔지니어링 전용 대비 인과적 버그 43%, 가정 버그 50% 감소
Key Takeaway
LLM은 강력한 역량을 보유하나, 제어 구조 없이는 컨텍스트 무감각·목표 불안정·세션 한계를 극복하지 못한다.
실천 포인트
장시간 자율 에이전트 개발 시 클리프-엣지 방지를 위해 컨텍스트 버짓 70%에서_rotation을 트리거하고, 실패를_generic retry 대신 분류별로 라우팅하면 시스템 안정성이 향상된다