피드로 돌아가기
System Architecture
Dev.toDev.to
AI/ML

수만 대 GPU 기반 Trajectory 학습을 통한 정밀 Code Editing 에이전트 구현

System Architecture

Aditya Pandey2026년 5월 7일10advanced

Context

단순 텍스트 생성 LLM의 한계로 인한 코드 수정 시의 Diff Problem 및 포맷팅 오류 발생. 대규모 코드베이스의 Context Window 초과 문제와 실행 환경의 보안 리스크가 병목 지점으로 작용.

Technical Solution

  • Auto Router 도입을 통한 요청 복잡도 기반 모델 동적 할당으로 응답 속도 최적화
  • (Original, Command, Final) 형태의 Trajectory 데이터 학습을 통한 정밀 Edit 능력 확보
  • Search and Replace 툴 사용 사례를 집중 학습시켜 모델 가중치 내에 기계적 제약 사항 내재화
  • ReAct 패턴 기반 Orchestrator 설계로 '추론-도구 실행-관찰-재추론'의 반복 루프 구축
  • 네트워크 및 파일시스템 접근이 제한된 Sandbox 환경을 통한 안전한 명령어 실행 보장
  • RAG 기반 Context Retrieval 시스템 적용으로 필요한 코드 스니펫만 추출하여 프롬프트 효율 증대

- Prompting만으로는 도구 호출의 신뢰성 확보가 어려우므로 Core Behavior로서의 모델 학습 검토 - 모든 단계에 Frontier Model을 사용하지 않고, 작업 난이도에 따라 모델을 분기하는 Routing 전략 적용 - 코드 수정 에이전트 설계 시 단순 텍스트 출력이 아닌 정밀한 Diff 포맷 유지 및 검증 로직 구축 - Sandbox를 단순 컨테이너가 아닌 스케줄링과 성능 튜닝이 필요한 독립 시스템으로 접근

원문 읽기