Function Calling 성공률 6.75% → 100% 개선한 하네스 엔지니어링 기법

Function Calling Harness, turning success rate from 6.75% to 100%

autobe2026년 4월 1일1분advanced

AI 요약

Context

기존 Qwen 모델은 재귀적 union 타입에서 Function Calling 실패율이 높았다. qwen3-coder-next는 첫 시도 성공률 6.75%, Qwen 3.5 전 모델군은 double-stringify 버그로 0%를 기록했다.

Function Calling 첫 시도 성공률이 6.75%에서 100%로 달성

결정론적 검증기가 존재하는 환경에서 AI 출력을 반복 교정하면 확률론적 모델도 결정론적 정확도에 수렴할 수 있다.

실천 포인트

LLM 기반 개발 환경에서 Function Calling 정확도를 확보하려면 컴파일러 기반 검증 + 자가 수복 루프를 적용 시 불안정성을 제거할 수 있다

태그