피드로 돌아가기
How I Built Memory Concierge: An AI Hotel Concierge That Remembers Guests
Dev.toDev.to
AI/ML

Llama 3.1 기반 Structured JSON 출력으로 구현한 Proactive AI Concierge 워크플로우

How I Built Memory Concierge: An AI Hotel Concierge That Remembers Guests

Abhilash Reddy Chitiki2026년 5월 16일6intermediate

Context

호텔 산업 내 분산된 고객 선호도 데이터를 단순 조회하는 기존 방식의 한계 분석. 단순 챗봇 형태가 아닌 실제 업무 프로세스에 통합되어 실시간으로 대응하는 Proactive 서비스 구조 설계 필요성 대두.

Technical Solution

  • Llama 3.1 70B 모델을 활용하여 Free-form 텍스트가 아닌 UI-ready Structured JSON 포맷의 응답을 강제하는 아키텍처 설계
  • NVIDIA NIM OpenAI-compatible endpoint를 통한 고성능 모델 추론으로 응답 신뢰성 및 렌더링 일관성 확보
  • /api/welcome 및 /api/adapt 라우트를 분리하여 정적 환영 메시지와 동적 이벤트 대응(Flight Delay 등) 로직을 체계화
  • API 비용 최적화를 위해 ElevenLabs TTS 기능을 사용자 트리거 기반의 On-demand 방식으로 구현
  • Local JSON 기반의 경량 데이터 저장소 설계를 통해 프로토타입 단계의 데이터 접근 속도와 구현 단순성 유지

- LLM 도입 시 단순 채팅 UI가 아닌 특정 도메인 역할(Role)과 구조화된 출력(Structured Output) 정의 여부 검토 - AI 생성 콘텐츠의 UI 매핑을 위해 JSON Schema 기반의 응답 규격 수립 및 검증 프로세스 구축 - 고비용 API(TTS, 고성능 LLM) 적용 시 자동 실행보다 사용자 이벤트 기반의 트리거 구조 설계

원문 읽기