피드로 돌아가기
Dev.toAI/ML
원문 읽기
Python Code 기반 액션 실행을 통한 Agent 표현력 극대화 및 Sandbox 보안 설계
smolagents Is Powerful Because It Runs Code. That Is Also the Boundary.
AI 요약
Context
기존 Agent 아키텍처는 JSON 형태의 Tool Call이나 단순 텍스트 요청에 의존하여 루프, 조건문, 중간 계산 등의 복잡한 로직 표현에 한계 존재. 이러한 제약으로 인해 정교한 작업 수행을 위한 도구 구성과 실행 흐름 제어의 효율성이 저하됨.
Technical Solution
- JSON 기반 Tool Call 대신 Python 코드를 직접 생성하고 실행하는 CodeAgent 구조 채택을 통한 표현력 확장
- 반복문과 조건문을 포함한 도구 조합(Tool Composition)을 자연스럽게 구현하여 복잡한 태스크 해결 능력 강화
- 코드 실행에 따른 보안 리스크 해결을 위해 Docker, E2B, Modal, Blaxel 등 외부 Sandbox 환경 연동 옵션 제공
- LiteLLM 및 MCP 서버 통합을 통한 다양한 Model Provider 및 Tool 생태계와의 유연한 인터페이스 구축
- 실행 전 도구 명시, 권한 확인, 복구 계획 수립을 포함하는 단계적 신뢰 구축 프로세스(Doramagic pack) 도입
실천 포인트
- Agent 도입 시 Read-only 도구부터 단계적으로 권한을 확장하는 단계적 배포 전략 검토 - 생성된 코드의 실행 환경을 로컬이 아닌 격리된 Sandbox(Docker 등)로 강제하는 설정 적용 - 도구 실행 전 사용자 승인 단계와 실행 실패 시의 자동 복구 시나리오(Recovery Plan) 설계 - API 키 및 시크릿 정보가 초기 실험 단계의 컨텍스트에 포함되지 않도록 격리 체계 구축