피드로 돌아가기
Dev.toBackend
원문 읽기
Power Automate와 REST API 기반의 20개 파일 배치 처리 파이프라인 구축
I batch-processed 20 meeting minutes with Power Automate + LDX hub. It took 2 days and 8 HTTP actions.
AI 요약
Context
MCP(Model Context Protocol) 기반의 1:1 인터랙티브 채팅 구조로는 다량의 문서 처리와 데이터 합산에 한계 존재. 20개의 Word 파일에서 구조화된 데이터를 추출하여 전사 대시보드를 생성하기 위한 배치 처리 시스템 필요성 대두.
Technical Solution
- SharePoint 내 파일 경로 기반의 Get file content 호출을 통한 바이너리 데이터 확보
- multipart/form-data 제약을 극복하기 위해 Chunk upload 방식(POST /uploads → PUT binary) 채택
- ExtractDoc 및 StructFlow API의 비동기 처리를 위한 Do until 루프 기반의 Polling 메커니즘 구현
- 루프 내 개별 결과물을 Array 변수에 누적하여 Scope 외부의 전역 분석 단계로 전달하는 상태 관리 설계
- ExtractDoc의 output_file_id를 통한 2차 텍스트 획득 과정 추가로 데이터 누락 방지
- 데이터 처리 엔진과 HTML 렌더링 레이어를 완전히 분리한 구조적 설계 적용
실천 포인트
1. API 엔드포인트의 버전 접두사(/api/v1 등) 존재 여부를 문서로 사전 검증
2. 대량 데이터 처리 전 1개 샘플 파일로 Edge Case 및 에러 핸들링 우선 검증
3. Low-code 툴의 GUI 조건식보다 Advanced mode의 명시적 표현식 사용 권장
4. 비동기 API 설계 시 Response Body의 직접 결과값 여부와 별도 리소스 ID 반환 여부 확인