피드로 돌아가기
Dev.toAI/ML
원문 읽기
Cookie 기반 인증 우회로 NotebookLM 자동화 구현 및 작업 시간 30분에서 2분으로 단축
Automating NotebookLM with Hermes Agent: From Research to Multi-Platform Content
AI 요약
Context
NotebookLM의 강력한 리서치 역량에도 불구하고 결과물 추출 및 배포 과정이 수동 작업으로 구성된 병목 지점 발생. Playwright 등 Headless Browser 기반 자동화 시도 시 Google의 봇 탐지 및 인증 차단으로 인한 구현 한계 직면.
Technical Solution
- 실제 Chrome 브라우저 세션의 Cookie를 Netscape 포맷으로 추출 후 Playwright storage_state.json으로 변환하여 Google 인증 우회
- notebooklm-py 래퍼를 활용해 Notebook 생성, 소스 추가, Artifact 생성을 위한 CLI 기반 인터페이스 구축
- 60초 이상의 긴 생성 시간이 소요되는 Audio 및 Image 작업의 Timeout 방지를 위해 --wait 옵션 대신 Task ID 기반의 Asynchronous Polling 구조 설계
- Hermes Agent와의 통합을 통해 리서치 결과물을 멀티 플랫폼 포맷으로 자동 라우팅하는 파이프라인 구성
- 2MB 제한이 있는 플랫폼 배포를 위해 ffmpeg를 이용한 이미지 리사이징 및 JPEG 압축 전처리 단계 추가
Impact
- 수동 파일 관리 및 배포 프로세스 시간을 30분에서 약 2분으로 93% 이상 단축
- 23개의 유효 Cookie 세션 유지를 통한 안정적인 API 액세스 권한 확보
실천 포인트
1. 강력한 봇 탐지 환경에서는 Headless Browser 대신 실제 세션 Cookie 주입 방식 검토
2. 장시간 소요되는 AI 생성 작업은 동기식 대기보다 Task ID 기반의 폴링 메커니즘 적용
3. 플랫폼별 데이터 제약 사항(예: 파일 크기)을 고려한 전처리 파이프라인(ffmpeg 등) 사전 설계