200단계 이상 Long-Horizon 작업 성공률 65% 달성한 MiMo Code

Xiaomi's MiMo Code gets better as tasks get harder. Here's how.

Andrew Kew2026년 6월 15일3분advanced

AI 요약

Context

기존 Coding Agent는 작업 단계가 증가함에 따라 Context Window 포화와 추론 일관성 상실로 인한 실패율 급증 문제 발생. 특히 인간의 보정 신호가 없는 장기 실행 환경에서 단일 단계의 에러가 전체 결과로 증폭되는 구조적 한계 존재.

Technical Solution

Max Mode 도입을 통한 5개 Parallel Candidates 생성 및 Low-temperature Judge 기반의 최적 경로 선택 구조 설계
Natural Language 시퀀스를 JavaScript 기반의 Dynamic Workflow(parallel, pipeline, barrier)로 변환하여 실행 제어의 정밀도 확보
Context Window의 20%, 45%, 70% 지점에서 사전 Checkpoint를 생성하는 Cycle 기반 Memory 관리 체계 구축
Main Agent와 분리된 별도의 Writer Subagent만 메모리에 접근하는 Single-writer 패턴 적용으로 상태 일관성 유지
Dream Agent와 Distill Agent를 통한 주기적(7일/30일) 메모리 최적화 및 재사용 가능한 SOP 추출 프로세스 자동화
독립적인 Verifier 모델을 통한 완료 조건 검증으로 Loop Rate 0.5% 미만 유지

실천 포인트

- LLM 상태 저장 시 Context Window의 70% 도달 전 Checkpoint 생성 로직 검토 - 상태 쓰기 권한을 전담 Subagent에게만 부여하는 Single-writer 패턴 적용 고려 - 자연어 기반 워크플로우를 실행 가능한 코드(JS 등)로 변환하여 제어 흐름의 결정론적 동작 확보

태그

#Context Window #Long-Horizon Tasks #Single Writer Pattern #Dynamic Workflow #State Management

원문 읽기