피드로 돌아가기
Dev.toBackend
원문 읽기
How to Process Unstructured RFQs using OpenAI RAG and Node.js
조달팀이 OpenAI RAG와 Node.js를 조합하여 비정형 RFQ 문서를 구조화된 발주 데이터로 변환
AI 요약
Context
조달 업무는 이메일, PDF, 스캔 문서 등 비정형 형식의 RFQ(견적 요청서)로 시작된다. 기존 시스템은 구조화된 데이터를 기대하지만 실제 RFQ는 일관된 스키마 없이 다양한 형식으로 도착하므로, 엔지니어 팀이 수동으로 읽고 해석하는 병목이 발생했다. 이는 느리고 오류가 많은 입찰 프로세스를 초래했다.
Technical Solution
- 문서 수집 및 전처리: 이메일 API, 대시보드 업로드, 써드파티 시스템 통합을 통해 RFQ를 수집하고, 파일 타입 감지 → OCR 처리 → 텍스트 정규화 단계를 거친다.
- RAG 파이프라인 구현: 추출된 RFQ 텍스트를 청크로 분할 및 벡터 임베딩하여 벡터 데이터베이스에 저장하고, 의미론적 검색으로 관련 청크를 검색 후 LLM으로 구조화 처리한다.
- LLM 기반 필드 추출: 상품 사양, 수량, 배송 기한, 가격 조건 등 구조화된 필드를 추출하여 비정형 텍스트를 시스템 처리 가능한 형식으로 변환한다.
- 벤더 응답 표준화: 벤더 입찰서를 통일된 스키마(item_name, quantity, unit_price, currency, delivery_time, compliance)로 강제하여 모든 입찰 비교 가능 상태를 만든다.
- Node.js 오케스트레이션 + AWS 인프라: Node.js를 백엔드 조율 계층으로 사용하고 AWS 클라우드에 배포하여 확장성과 신뢰성을 확보한다.
Key Takeaway
조달 플랫폼은 RAG를 활용한 AI 기반 문서 처리와 표준화된 스키마 강제를 결합하면 비정형 RFQ를 자동화 가능한 구조화 데이터로 변환할 수 있으며, 이는 수동 병목을 제거하고 기계 규모의 인텔리전트 조달 시스템으로의 전환을 가능하게 한다.
실천 포인트
조달, 송장, 청구서 등 비정형 문서를 처리하는 백오피스 플랫폼을 구축할 때, 전체 문서를 LLM에 전달하는 대신 청킹 → 벡터 임베딩 → 의미론적 검색 → 필드 추출의 RAG 파이프라인을 적용하면 LLM 비용을 절감하면서 정확도를 높이고, 도메인별 통일 스키마를 강제하면 후속 자동 평가 및 의사결정 단계를 연결할 수 있다.