피드로 돌아가기
Dev.toAI/ML
원문 읽기
로컬 AST 분석으로 코드베이스를 완벽히 이해하는 AI 코딩 시스템 구축
I built a local AI coding system that actually understands your codebase — here's what I learned
AI 요약
Context
기존 AI 도구의 일회성 컨텍스트 처리 방식에 따른 프로젝트 구조 이해 부족. 세션마다 반복되는 코드 스니펫 제공과 문맥 설명의 비효율성. 코드베이스 전체를 기억하지 못하는 외부 LLM의 한계.
Technical Solution
- Full AST analysis 기반의 프로젝트 스캔을 통한 함수, 클래스, 의존성 관계의 정밀한 맵핑
- ChromaDB와 sentence-transformers를 결합하여 코드베이스 내 심볼을 빠르게 탐색하는 인덱싱 구조
- LLM 추론 없이 AST 인덱스에서 직접 결과를 반환하는 Sub-2ms 수준의 자동 완성 로직
- Git 커밋 내역을 시맨틱하게 분석하여 버그 유발 지점을 확률적으로 예측하는 Semantic git bisect 구현
- 엣지 케이스 입력을 자동 생성하여 코드의 취약점을 찾아내는 Adversarial code verification 프로세스
- QLoRA 파인튜닝 파이프라인을 통해 사용자의 개별 코딩 패턴을 학습하는 지속적 모델 최적화 전략
Impact
- AST 기반 프로젝트 스캔 속도: 91개 파일 기준 5674ms
- 코드 자동 완성 응답 속도: 0.8ms (Sub-2ms)
- 버그 탐지 성능: 1초 미만 내 3개의 버그 식별
- 운영 비용: 월 $0 (Full Local)
- 시스템 규모: Python 27,000라인, 테스트 케이스 500개 이상
Key Takeaway
AI 코딩 도구의 핵심 가치는 모델의 파라미터 크기보다 프로젝트 전체 구조를 파악하는 '코드베이스 인식(Project Awareness)' 설계에 있음.
실천 포인트
로컬 AI 도입 시 단순 RAG를 넘어 AST 기반의 의존성 그래프를 구축하여 코드 간 관계를 명시적으로 관리할 것