피드로 돌아가기
'"An LLM and a harness": Nvidia''s simple thesis on what agents actually are'
Dev.toDev.to
AI/ML

LLM과 Harness 분리를 통한 엔터프라이즈 AI 에이전트 신뢰성 확보 전략

'"An LLM and a harness": Nvidia''s simple thesis on what agents actually are'

Andrew Kew2026년 6월 22일2intermediate

Context

모델 성능의 비약적 발전에도 불구하고 엔터프라이즈 환경에서의 에이전트 실행 신뢰성 부족 문제 발생. 단순 모델 튜닝만으로는 보안 정책 준수 및 예측 가능한 제어 흐름 구현에 한계 노출.

Technical Solution

  • LLM과 Harness를 분리하여 모델은 지능을 제공하고 Harness는 실행 루프와 제어를 담당하는 구조 설계
  • OpenClaw 기반의 에이전트 루프를 통해 목표 도달을 위한 단계적 반복 수행 로직 구현
  • NemoClaw 레퍼런스 아키텍처를 통한 GPU Routing 및 보안 정책(Security Policies) 계층 통합
  • OpenShell 런타임 도입을 통한 하드웨어 가속 기반의 일관된 에이전트 실행 환경 구축
  • 시스템 프롬프트, 메모리, 파일 컨텍스트를 모델 외부의 Harness 계층으로 정의하여 제품 확장성 확보
  • CUDA X 모델을 벤치마킹하여 하드웨어 최적화와 소프트웨어 블루프린트를 결합한 인프라 생태계 전략 채택

1. 에이전트 설계 시 모델 업데이트와 무관하게 유지되어야 할 제어 로직을 Harness 계층으로 완전히 분리했는지 검토

2. 도메인 특화 에이전트 구축 시 단순 프롬프팅 대신 전용 런타임 및 보안 정책 계층 도입 고려

3. 에이전트 실패 지점을 모델의 추론 오류와 Harness의 실행 오류로 구분하여 모니터링 체계 구축

원문 읽기