피드로 돌아가기
Dev.toAI/ML
원문 읽기
수만 대 GPU 기반 Trajectory 학습을 통한 정밀 Code Editing 에이전트 구현
System Architecture
AI 요약
Context
단순 텍스트 생성 LLM의 한계로 인한 코드 수정 시의 Diff Problem 및 포맷팅 오류 발생. 대규모 코드베이스의 Context Window 초과 문제와 실행 환경의 보안 리스크가 병목 지점으로 작용.
Technical Solution
- Auto Router 도입을 통한 요청 복잡도 기반 모델 동적 할당으로 응답 속도 최적화
- (Original, Command, Final) 형태의 Trajectory 데이터 학습을 통한 정밀 Edit 능력 확보
- Search and Replace 툴 사용 사례를 집중 학습시켜 모델 가중치 내에 기계적 제약 사항 내재화
- ReAct 패턴 기반 Orchestrator 설계로 '추론-도구 실행-관찰-재추론'의 반복 루프 구축
- 네트워크 및 파일시스템 접근이 제한된 Sandbox 환경을 통한 안전한 명령어 실행 보장
- RAG 기반 Context Retrieval 시스템 적용으로 필요한 코드 스니펫만 추출하여 프롬프트 효율 증대
실천 포인트
- Prompting만으로는 도구 호출의 신뢰성 확보가 어려우므로 Core Behavior로서의 모델 학습 검토 - 모든 단계에 Frontier Model을 사용하지 않고, 작업 난이도에 따라 모델을 분기하는 Routing 전략 적용 - 코드 수정 에이전트 설계 시 단순 텍스트 출력이 아닌 정밀한 Diff 포맷 유지 및 검증 로직 구축 - Sandbox를 단순 컨테이너가 아닌 스케줄링과 성능 튜닝이 필요한 독립 시스템으로 접근