피드로 돌아가기
I Don't Understand Embedded. I Was Still the Only One Who Could Ship It.
Dev.toDev.to
DevOps

Ground Truth 부재로 인한 LLM 에이전트의 7차례 반복적 실패와 Harness의 필요성

I Don't Understand Embedded. I Was Still the Only One Who Could Ship It.

Antonio Zhu2026년 6월 26일10intermediate

Context

Linux 호스트의 gcc 환경과 Windows 기반 RISC-V cross-compiler 환경 간의 Toolchain 불일치로 인한 빌드 격차 발생. LLM 에이전트가 타겟 환경의 실제 컴파일 결과(Ground Truth)를 관찰하지 못한 채 추론만으로 패치를 시도하는 구조적 한계 노출.

Technical Solution

  • Host GCC와 Target Cross-compiler 간의 환경 분리로 인한 Feedback Loop 지연 문제 식별
  • 에이전트의 General Knowledge와 특정 버전 SDK의 Runtime Behavior 간의 괴리 분석
  • 단순한 Test Suite를 넘어 에이전트와 Ground Truth 사이의 거리를 좁히는 Harness 설계 필요성 도출
  • 증상 해결 위주의 Patching 방식에서 벗어나 Driver 선택 로직을 파일 기반으로 변경하는 Structural Change 적용
  • 에이전트의 근거 없는 Confidence를 제어하기 위한 엔지니어의 경계 감시 및 제약 조건 명시

1. AI 에이전트 도입 시 Local Test 환경과 실제 Production Toolchain 간의 환경 일치 여부 검토

2. 에이전트가 '모른다'고 말하지 않는 특성을 고려하여, 추론 결과에 대한 검증 단계(Verification)를 강제하는 워크플로우 설계

3. 반복적인 패치 실패 발생 시 단순 수정이 아닌 시스템 구조적 결함(Architecture Flaw) 가능성 우선 검토

4. 에이전트가 접근 불가능한 외부 컨텍스트(파일, 환경 변수 등)가 의사결정에 영향을 주는지 확인

원문 읽기