피드로 돌아가기
Hacker NewsAI/ML
원문 읽기
Context Retrieval 최적화로 도구 호출 96회에서 5회로 단축
What 1,281 agent runs reveal about coding agent failure in large codebases
AI 요약
Context
대규모 엔터프라이즈 코드베이스(400k lines 이상)에서 LLM 기반 코딩 에이전트가 겪는 Context Window 오염과 탐색 실패 분석. 단순한 모델 지능의 한계가 아닌, grep 및 단순 텍스트 매칭 위주의 인프라로 인한 Tool Thrashing 현상이 병목 지점으로 작용함.
Technical Solution
- 텍스트 기반 검색에서 관계 중심의 Structural Navigation 구조로 전환하여 검색 정밀도 향상
- 코드베이스의 내부 API, 라이브러리, 아키텍처 컨벤션을 버전 관리되는 Skills 형태로 사전 인코딩하여 제공
- 불필요한 파일 읽기를 방지하는 정밀한 Context Engineering을 통해 LLM의 추론 컨텍스트 희석 방지
- Multi-repo 환경의 의존성 파악을 위한 버전 매칭 기반의 외부 패키지 문서 Registry 통합
- 단순 도구 추가가 아닌 Retrieval Quality 중심의 인프라 설계를 통해 에이전트의 Improvisation 최소화
실천 포인트
- 40만 라인 이상의 코드베이스에서 단순 grep 기반 에이전트 워크플로우 사용 지양 - 에이전트에게 제공하는 Tool의 수를 제한하고 검색 결과의 정밀도(Precision)를 높이는 필터링 레이어 검토 - 아키텍처 컨벤션과 내부 API 명세서를 LLM이 즉시 참조 가능한 정형화된 Skill 데이터로 변환하여 제공 - Multi-repo 작업 시 로컬 수정이 전체 시스템에 미치는 영향을 검증하는 Atomic Commit 및 통합 테스트 자동화 확인