Heartbeat 기반 Context Replay로 인한 토큰 낭비 해결 및 상태 기반 아키텍처 전환

My OpenClaw agent looked idle overnight and still burned through tokens

Lars Winstand2026년 5월 12일8분intermediate

AI 요약

Context

OpenClaw 에이전트가 유휴 상태에서도 지속적으로 full_conversation_history를 전송하는 Heartbeat 메커니즘으로 인해 불필요한 토큰 비용이 발생하는 구조적 한계 노출. 세션 시간이 길어질수록 Context 크기에 비례하여 비용이 기하급수적으로 증가하는 Context Replay Tax 문제 발생.

Technical Solution

Immortal Session 구조를 지양하고 Task 단위의 Bounded Session 설계로 전환
세션 종료 전 최소 상태 정보를 기록하는 Handoff File 도입을 통해 다음 세션의 Context 크기 최소화
주기적 요약(Summarization) 과정에서 발생하는 정보 손실 및 복구 비용(Repair Loop)을 방지하기 위해 명시적 상태 전달 방식 채택
API 폴링 및 단순 모니터링 등 Deterministic Work를 Python 스크립트와 Cron Job으로 분리하여 모델 호출 횟수 최적화
단순 라우팅 및 유지보수 작업에 고성능 모델 대신 하위 모델을 사용하는 Model Tiering 적용
토큰 기반 과금 모델의 제약을 제거하기 위해 Flat Monthly Pricing 기반의 인프라 검토로 설계 최적화 방향 수정

실천 포인트

1. LLM 세션이 무한히 길어지는 구조인지 확인하고 Task 기반의 세션 분리 적용

2. 에이전트 간 상태 전달 시 전체 히스토리 대신 Handoff 파일 형태의 최소 상태 전송 설계

3. 결정론적 작업(Polling, Log Watching)을 LLM 외부의 스크립트/Cron으로 이관

4. 작업 복잡도에 따른 모델 티어링(Tiering) 전략 수립 및 적용

태그

#Model Tiering #Context Window #Event-Driven #Token Optimization #State Management

원문 읽기