피드로 돌아가기
Dev.toAI/ML
원문 읽기
Llama 3.1 기반 Structured JSON 출력으로 구현한 Proactive AI Concierge 워크플로우
How I Built Memory Concierge: An AI Hotel Concierge That Remembers Guests
AI 요약
Context
호텔 산업 내 분산된 고객 선호도 데이터를 단순 조회하는 기존 방식의 한계 분석. 단순 챗봇 형태가 아닌 실제 업무 프로세스에 통합되어 실시간으로 대응하는 Proactive 서비스 구조 설계 필요성 대두.
Technical Solution
- Llama 3.1 70B 모델을 활용하여 Free-form 텍스트가 아닌 UI-ready Structured JSON 포맷의 응답을 강제하는 아키텍처 설계
- NVIDIA NIM OpenAI-compatible endpoint를 통한 고성능 모델 추론으로 응답 신뢰성 및 렌더링 일관성 확보
- /api/welcome 및 /api/adapt 라우트를 분리하여 정적 환영 메시지와 동적 이벤트 대응(Flight Delay 등) 로직을 체계화
- API 비용 최적화를 위해 ElevenLabs TTS 기능을 사용자 트리거 기반의 On-demand 방식으로 구현
- Local JSON 기반의 경량 데이터 저장소 설계를 통해 프로토타입 단계의 데이터 접근 속도와 구현 단순성 유지
실천 포인트
- LLM 도입 시 단순 채팅 UI가 아닌 특정 도메인 역할(Role)과 구조화된 출력(Structured Output) 정의 여부 검토 - AI 생성 콘텐츠의 UI 매핑을 위해 JSON Schema 기반의 응답 규격 수립 및 검증 프로세스 구축 - 고비용 API(TTS, 고성능 LLM) 적용 시 자동 실행보다 사용자 이벤트 기반의 트리거 구조 설계