피드로 돌아가기
My OpenClaw agent looked idle overnight and still burned through tokens
Dev.toDev.to
AI/ML

Heartbeat 기반 Context Replay로 인한 토큰 낭비 해결 및 상태 기반 아키텍처 전환

My OpenClaw agent looked idle overnight and still burned through tokens

Lars Winstand2026년 5월 12일8intermediate

Context

OpenClaw 에이전트가 유휴 상태에서도 지속적으로 full_conversation_history를 전송하는 Heartbeat 메커니즘으로 인해 불필요한 토큰 비용이 발생하는 구조적 한계 노출. 세션 시간이 길어질수록 Context 크기에 비례하여 비용이 기하급수적으로 증가하는 Context Replay Tax 문제 발생.

Technical Solution

  • Immortal Session 구조를 지양하고 Task 단위의 Bounded Session 설계로 전환
  • 세션 종료 전 최소 상태 정보를 기록하는 Handoff File 도입을 통해 다음 세션의 Context 크기 최소화
  • 주기적 요약(Summarization) 과정에서 발생하는 정보 손실 및 복구 비용(Repair Loop)을 방지하기 위해 명시적 상태 전달 방식 채택
  • API 폴링 및 단순 모니터링 등 Deterministic Work를 Python 스크립트와 Cron Job으로 분리하여 모델 호출 횟수 최적화
  • 단순 라우팅 및 유지보수 작업에 고성능 모델 대신 하위 모델을 사용하는 Model Tiering 적용
  • 토큰 기반 과금 모델의 제약을 제거하기 위해 Flat Monthly Pricing 기반의 인프라 검토로 설계 최적화 방향 수정

1. LLM 세션이 무한히 길어지는 구조인지 확인하고 Task 기반의 세션 분리 적용

2. 에이전트 간 상태 전달 시 전체 히스토리 대신 Handoff 파일 형태의 최소 상태 전송 설계

3. 결정론적 작업(Polling, Log Watching)을 LLM 외부의 스크립트/Cron으로 이관

4. 작업 복잡도에 따른 모델 티어링(Tiering) 전략 수립 및 적용

원문 읽기