피드로 돌아가기
InfoQInfoQ
Infrastructure

API 없는 레거시 앱을 위한 Computer Vision 기반 AI Agent 가상 데스크톱 환경 구축

AWS WorkSpaces Now Lets AI Agents Operate Legacy Desktop Applications Without APIs

Steef-Jan Wiggers2026년 5월 13일3intermediate

Context

Fortune 500 기업의 71%가 API 접근이 불가능한 Mainframe 기반 레거시 시스템을 운용하는 제약 상황 발생. 기존의 Modernization 프로젝트는 막대한 비용과 시간이 소요되어 AI Agent 도입의 실질적인 병목 지점으로 작용함.

Technical Solution

  • Human-centric Desktop 환경을 AI Agent에 그대로 제공하여 애플리케이션 수정 없는 자동화 구현
  • Computer Vision 기반의 Screenshot 캡처와 Input Simulation(Click, Type, Scroll)을 통한 UI 레벨 인터랙션 수행
  • MCP(Model Context Protocol) 엔드포인트 노출을 통한 LangChain, CrewAI 등 프레임워크 독립적 연결 구조 설계
  • IAM 기반의 고유 ID 부여 및 isolated WorkSpaces 인스턴스 배치를 통한 엔터프라이즈급 격리 및 보안 모델 적용
  • CloudTrail과 CloudWatch 연동을 통한 AI Agent 활동의 전체 감사 추적 및 Observability 확보
  • 작업 단위의 Ephemeral 인스턴스 생성 및 삭제 전략을 통한 클라우드 리소스 비용 최적화

1. 자동화 대상 앱의 API 존재 여부에 따른 API-first vs UI-first 경로 결정

2. UI-first 채택 시 Vision 모델의 정확도 향상을 통한 Screenshot 횟수 최적화 검토

3. Agent별 고유 IAM Identity 부여를 통한 감사 로그 분리 설계

4. 고비용 토큰 소모를 방지하기 위한 Ephemeral 인스턴스 라이프사이클 관리

원문 읽기