피드로 돌아가기
PaperBanana: Automating Research Diagrams With an Agentic AI Framework
Dev.toDev.to
AI/ML

PaperBanana: Automating Research Diagrams With an Agentic AI Framework

Google이 agentic AI 프레임워크(PaperBanana)를 개발해 자연언어 기술로 출판 수준의 연구 논문 도표를 생성하는 critic-generator 반복 루프 도입

Dextra Labs2026년 3월 26일9intermediate

Context

기존 자연언어-차트 도구들은 단일 패스 생성 후 개선 메커니즘이 없어 출판 수준의 도표 생성에 실패했다. 연구자들이 matplotlib 문제 해결(축 라벨 잘림, 색상 접근성, 저널별 포맷 요구사항)에 소모되며 실제 연구 인사이트에 집중할 수 없었다.

Technical Solution

  • Planner Agent에서 자연언어 요청을 해석해 차트 유형과 데이터 변환을 명시한 사양(spec) 생성
  • Code Generator Agent가 사양을 matplotlib/seaborn/plotly 코드로 번역
  • Executor Agent가 샌드박스 환경에서 코드 실행해 출력과 오류 캡처
  • Critic Agent가 출판 기준(도표 너비, 색상 접근성, 폰트 가중치 등) 대비 평가해 구조화된 피드백 생성: 심각도 레벨(HIGH/MEDIUM/LOW), 카테고리, 메시지, 구체적 수정 방안 제공
  • Code Generator → Executor → Critic 루프가 품질 임계값(quality_threshold=0.85) 도달 또는 최대 반복 횟수까지 순회

Impact

  • 루프 수렴: 대부분의 도표 유형에서 3~5회 반복으로 수렴
  • Critic 피드백 품질: Claude Sonnet 백엔드 사용 시 다른 LLM 대비 구조화된 피드백 정확성 향상으로 루프 수렴 속도 개선

Key Takeaway

다차원 품질 평가가 필요한 작업(코드 리뷰, 문서 포맷팅, 데이터 파이프라인 검증, 보고서 생성)에서 구조화된 피드백을 제공하는 critic-generator 루프 패턴을 적용하면 단일 패스 생성의 한계를 극복할 수 있다.


연구 논문 작성 및 보고서 자동화가 필요한 팀에서 PaperBanana의 critic-generator 반복 아키텍처를 참고해 구현하면, 자연언어 입력만으로 출판/규정 수준의 시각화 및 문서를 3~5회 반복으로 생성할 수 있다. 특히 Critic Agent의 구조화된 피드백(severity 레벨, 카테고리, 구체적 수정안)이 수렴 속도를 크게 결정하므로, 도메인별 품질 기준을 명확히 정의하는 것이 핵심이다.

원문 읽기