피드로 돌아가기
Dev.toFrontend
원문 읽기
Markdown 구조 보존을 통한 DeepSeek 채팅 데이터 Export 파이프라인 구축
Export Your DeepSeek Chats to Word, PDF, Google Docs, Markdown & Notion in One Click
AI 요약
Context
단순 Copy-paste 방식의 데이터 추출 시 발생하는 Code Block 및 Table 포맷 붕괴 문제 분석. Markdown 기반의 구조적 데이터를 PDF, Word, Notion 등 이기종 문서 포맷으로 변환하는 과정에서의 데이터 무결성 유지 필요성 대두.
Technical Solution
- DOM Parsing을 통한 DeepSeek 채팅 인터페이스 내 개별 메시지 및 프롬프트 단위 데이터 추출
- Nested Code Block 및 Table 구조의 일관된 렌더링을 위한 Markdown 기반 중간 표현층(Intermediate Representation) 설계
- Notion API 연동을 통한 대화 데이터의 Database Direct Push 기능 구현
- PDF, .docx 등 바이너리 포맷 변환 시 스타일 손실 방지를 위한 Custom Styling 엔진 적용
- 사용자 선택 범위에 따른 Full Conversation 및 Selected Message 필터링 로직 구현
실천 포인트
1. 비정형 웹 데이터를 외부 문서로 변환 시 Markdown을 중간 표준 포맷으로 활용하여 데이터 손실 최소화
2. 다양한 Export 타겟(PDF, Word, Notion) 대응을 위한 포맷별 렌더링 어댑터 패턴 검토
3. 복잡한 Nested Structure를 가진 문서 변환 시 일관된 포맷팅을 위한 스타일 가이드라인 정의