피드로 돌아가기
GeekNewsAI/ML
원문 읽기
Garry Tan의 "Skillify" — AI 에이전트의 실패를 영구적 구조 수정으로 바꾸는 방법론
AI 에이전트 실패를 Deterministic 스킬로 전환하는 회귀 테스트 기반 품질 체계 구축
AI 요약
Context
LLM의 추론 영역(Latent)과 코드 실행 영역(Deterministic)의 경계 모호함으로 인한 런타임 오류 발생. 기존 프레임워크는 테스트 도구만 제공할 뿐 실패를 영구적 구조 수정으로 연결하는 워크플로가 부재한 상황.
Technical Solution
- LLM 암산에 의한 오류를 방지하기 위해 정밀 작업의 Deterministic 스크립트 이관 및 강제 실행 구조 설계
- 실패 사례를 재현 불가능하게 만드는 '마크다운 절차서 + 실행 스크립트 + 유닛/통합 테스트'의 스킬 단위 패키징
- LLM-as-judge 기반 평가와 리졸버 트리거 등록을 통한 스킬의 발견 가능성(Discoverability) 확보
- 신규 스킬 추가 시 E2E 스모크 테스트와 브레인 파일링 규칙을 적용한 회귀 테스트 자동화
- 스킬 부패 방지를 위해 생성(Generation) 단계 이후 검증(Verification) 프로세스를 필수 단계로 포함하는 파이프라인 구축
실천 포인트
- LLM이 처리하는 작업 중 시간 계산, 데이터 검색 등 결정론적 결과가 필요한 영역을 식별하여 코드로 분리했는가 - 에이전트의 실패 사례마다 이를 재현하고 검증할 수 있는 유닛 테스트와 통합 테스트를 작성했는가 - 생성된 스킬이 시스템 내에서 올바르게 호출될 수 있도록 리졸버(Resolver) 등록 및 도달 가능성을 검증했는가