피드로 돌아가기
I Built a Production AI Pipeline for a UK FinTech — Here's What Actually Happened
Dev.toDev.to
AI/ML

Gemini 기반 비동기 AI 파이프라인 및 문서 워크플로우 구축을 통한 브로킹 업무 자동화

I Built a Production AI Pipeline for a UK FinTech — Here's What Actually Happened

Fouzi Oukacha2026년 6월 20일21intermediate

Context

수동 데이터 입력과 반복적인 문서 작성으로 인한 고비용의 휴먼 리소스 낭비 발생. 기존 OpenAI 기반 문서 추출 기능을 넘어 콜 로그, 이메일, CRM 데이터를 통합 분석하는 엔드 투 엔드 AI 파이프라인 필요성 대두.

Technical Solution

  • Google Cloud 생태계 통합을 위해 OpenAI에서 Gemini on Vertex AI로 모델 및 인프라 마이그레이션 수행
  • LLM의 응답 지연으로 인한 UX 저하 방지를 위해 'POST → 202 Accepted → Background Job → Socket.io → Redux'로 이어지는 비동기 통신 아키텍처 설계
  • Aircall API의 트랜스크립트와 CRM 내 10개 이상의 탭에 분산된 딜 컨텍스트를 결합한 정밀 프롬프트 엔지니어링 적용
  • AI 생성 HTML의 XML 변환 오류 해결을 위해 변환 전 전처리 Sanitization 로직을 도입한 Word 내보내기 파이프라인 구현
  • AI 결과물을 단순 출력하지 않고 버전 관리(최대 28개 Draft), 섹션 재배치 및 가시성 제어가 가능한 인터랙티브 에디터 구축을 통해 Human-in-the-loop 워크플로우 완성

1. LLM 응답 대기 시간 최적화를 위해 동기식 API 호출 대신 웹소켓 기반의 비동기 상태 업데이트 패턴 검토

2. AI 생성 콘텐츠를 외부 문서 형식(Word, PDF)으로 변환 시, 모델의 불완전한 토큰 출력을 처리할 데이터 정제 레이어 필수 배치

3. AI 결과물의 신뢰도 확보를 위해 생성 근거가 된 소스 데이터를 추적할 수 있는 Reference 매핑 구조 설계

4. 단순 Generation 기능을 넘어 사용자가 결과를 수정하고 버전 관리할 수 있는 Editing 인터페이스 제공으로 실무 적용성 강화

원문 읽기