피드로 돌아가기
토스플레이스 데이터봇 ‘판다(PANDA)’를 소개합니다 : 모든 팀원이 데이터 전문가처럼 일하는 방법
토스 기술블로그토스 기술블로그
AI/ML

토스플레이스 데이터봇 ‘판다(PANDA)’를 소개합니다 : 모든 팀원이 데이터 전문가처럼 일하는 방법

SSOT 정비와 Agentic Loop 도입으로 데이터 요청 70%를 자동화한 PANDA

2026년 4월 23일9intermediate

Context

단순 수치 추출 요청이 전체의 70%를 차지하여 데이터 분석가의 리소스 낭비 발생. 초기 AI 챗봇 도입 시 불필요한 토큰 소비, 일관성 없는 테이블 선택, 비즈니스 로직 오해로 인한 Snowflake 비용 증가 및 데이터 부정확성 문제 직면.

Technical Solution

  • {mart_type}{domain}{subject} 규칙의 DW 표준화 컨벤션을 통한 SSOT(Single Source of Truth) 구축 및 AI 탐색 정확도 제고
  • 비즈니스 언어 체계 구축을 통한 도메인 지식과 데이터 구조 간의 매핑으로 문맥적 해석 오류 해결
  • 유사도 점수와 계층 가중치(전사 지표 x4 ~ 로그 x1)를 결합한 Scoring & Ranking 시스템 설계로 테이블 선택의 일관성 확보
  • dbt tags 기반의 Manifest 파일 관리를 통해 탐색 범위를 제한함으로써 쿼리 효율성 증대 및 비용 최적화
  • Tool 선택, 결과 검토, 자율적 재시도를 수행하는 Agentic Loop 구조 설계로 정답 도출의 자율성 보장
  • '결과-기준-인사이트'로 구성된 답변 구조 설계를 통해 분석가의 사고 과정을 모사한 결과 제공

1. AI 연동 테이블의 네이밍 룰을 {역할}_{영역}_{주제} 형태로 표준화했는지 검토

2. 단순 유사도 검색 대신 데이터 계층별 가중치를 적용한 랭킹 로직 도입 고려

3. 무조건적인 전체 스캔 대신 dbt tags 등으로 AI의 탐색 컨텍스트 범위를 제한했는지 확인

4. 단판 승부식 프롬프트가 아닌, 오류 수정과 재시도가 가능한 Agentic Loop 구조 설계

원문 읽기