피드로 돌아가기
Dev.toAI/ML
원문 읽기
CLI Wrapper 기반 LLM 게이트웨이의 지속성 및 다각화 구현
What's new in llm-cli-gateway
AI 요약
Context
API Proxying 대비 CLI Wrapping의 강점인 실제 파일 접근 및 세션 상태 유지를 목표로 설계된 시스템. 기존 구조는 Codex의 세션 연속성 결여와 비동기 작업의 폴링 타임아웃으로 인한 중복 실행 및 자원 낭비라는 한계점을 보유함.
Technical Solution
- Codex의
exec resume및exec resume --last명령어를 직접 연결하여 실제 CLI 세션 UUID 기반의 Continuity 확보 - xAI Grok CLI 추가를 통한 모델 간 Training Lineage 다양화로 Consensus Diversity 및 보안 검토 신뢰도 향상
- SQLite 기반의 Flight Recorder를 활용한 Async Job 상태 전이(Start, Flush, Completion) 기록 및 Durable Store 구현
- 동일 요청에 대해 1시간 기본 윈도우를 적용한 Dedup 로직을 통해 중복 인보케이션 방지 및 결과 재사용 최적화
- Gateway 중단 시 Running 상태인 작업을 Orphaned로 마킹하여 재부팅 후에도 부분 출력물을 조회 가능한 복구 메커니즘 설계
forceRefresh: true옵션을 제공하여 캐시된 결과 대신 강제 재실행이 필요한 엣지 케이스 대응
실천 포인트
1. 비동기 롱런 작업 설계 시 폴링 타임아웃에 대비한 Durable Result Layer 구축 검토
2. LLM 합의 알고리즘 적용 시 단순 모델 개수가 아닌 학습 데이터 소스의 독립성(Diversity) 확인
3. 외부 CLI 래핑 시 단순 셸 호출이 아닌 원본 CLI가 제공하는 세션 복구 플래그의 완전한 매핑 확인