피드로 돌아가기
Dev.toAI/ML
원문 읽기

Plan-and-Solve 도입을 통한 ReAct의 Greedy 전략 한계 극복 및 Global Planning 구조 설계
Agent Series (3): Plan-and-Solve — Think First, Then Act
AI 요약
Context
ReAct의 Greedy 전략으로 인한 단계별 국소 최적화 및 Global Plan 부재로 인한 불필요한 단계 반복 발생. 다단계 의존성이 존재하는 Task에서 경로 예측 불가 및 실행 효율 저하라는 구조적 한계 노출.
Technical Solution
- LLM을 통한 전역 작업 분석 및 3~7단계의 구체적 Action Plan을 사전 생성하는 Two-Phase Architecture 설계
- Plan Node에서 도구 호출을 배제하고 순수 추론만 수행하여 전체 실행 경로의 결정론적 제어 확보
- Execute Node 내부에 ReAct Sub-Agent를 임베딩하여 전역 구조(Plan-and-Solve)와 국소 도구 실행(ReAct)을 계층적으로 분리
- 실행 실패 시 잔여 단계를 재조정하는 Replan Node를 통한 Fault-tolerance 메커니즘 구현
- LangGraph의 StateGraph를 활용하여 Task, Plan, Completed Steps 등 상태 정보를 공유하는 State-based Flow 구축
- 단계 간 데이터 전달 시 자연어 요약의 정보 손실을 방지하기 위해 Structured JSON 포맷 도입
실천 포인트
1. LLM의 Context 기억력에 의존하지 않고 단계별 결과물을 Structured JSON으로 저장하고 있는가?
2. 다단계 의존성 Task에서 ReAct의 Greedy Loop 대신 사전 Plan 생성 단계를 적용했는가?
3. 실행 실패 상황을 대비한 Replan 로직이 State Machine 내에 정의되어 있는가?
4. 전역 플래너의 프롬프트에 구체적인 단계 수(예: 3~7단계)와 최종 합성 단계가 명시되었는가?