피드로 돌아가기
Coding Agents Suck at Tools
Dev.toDev.to
AI/ML

다중 Tool 제거 및 Elixir Eval 단일 인터페이스 도입을 통한 Context 오염 해결

Coding Agents Suck at Tools

Rocking Eval2026년 6월 21일3advanced

Context

다양한 Tool 정의와 개별 Instruction의 Context 주입으로 인한 Token 낭비 및 모델 주의력 분산 발생. 특히 JSON 페이로드 포맷팅과 복잡한 File Editing 과정에서 발생하는 문법 오류가 Context를 오염시켜 모델의 무한 루프와 코드 손상을 유발하는 구조적 한계 노출.

Technical Solution

  • 다수의 전용 Tool을 제거하고 Elixir Eval이라는 단일 실행 환경으로 통합한 아키텍처 설계
  • Bash와 유사한 Piping 동작 및 표준 File API를 제공하는 Elixir 언어의 특성을 활용해 모델의 학습 데이터 기반 역량 극대화
  • 복잡한 JSON 규격 대신 모델이 숙달된 Functional Language 기반의 코드 생성 방식으로 인터페이스 단순화
  • 실행 실패 시 일관된 Elixir Error Trace를 피드백하여 런타임 중 모델의 자체 교정 능력을 강화하는 루프 구축
  • AST 맵핑 및 Line Diff 계산의 어려움을 코드를 통한 코드 수정 방식으로 전환하여 정밀도 향상

- Agent 설계 시 Tool 개수를 최소화하여 Context Window의 Noise를 줄이고 있는지 검토 - 모델에게 복잡한 JSON 포맷팅을 강제하기보다 모델이 익숙한 프로그래밍 언어 기반의 인터페이스 제공 고려 - 에러 메시지의 형식을 표준화하여 모델이 실패 지점을 정확히 파악하고 스스로 수정할 수 있는 피드백 루프 설계

원문 읽기