피드로 돌아가기
Introducing SyGra Studio
Hugging Face BlogHugging Face Blog
Backend

SyGra 2.0.0이 Studio라는 비주얼 캔버스 환경을 도입해 합성 데이터 생성 워크플로우를 YAML 파일 작성에서 드래그앤드롭 기반 그래프 구성으로 전환

Introducing SyGra Studio

2026년 2월 5일7intermediate

Context

합성 데이터 생성 작업이 YAML 파일 작성과 터미널 명령어 조합에 의존하면서 설정 검증, 프롬프트 튜닝, 실시간 실행 모니터링이 비효율적이었다.

Technical Solution

  • 비주얼 캔버스 인터페이스 도입: Start/End 노드 자동 생성, 팔레트에서 블록(LLM 노드, Lambda, Subgraph)을 드래그하여 워크플로우 구성
  • 데이터 소스 커넥터 및 프리뷰: Hugging Face, 파일시스템, ServiceNow 데이터 소스 연결 후 실행 전 샘플 행 확인 가능
  • 자동 상태 변수 추출: 데이터 소스의 컬럼명이 자동으로 {prompt}, {genre} 같은 상태 변수로 변환되어 프롬프트 내에서 즉시 참조 가능
  • 모델 설정 양식 기반 구성: OpenAI, Azure OpenAI, Ollama, Vertex, Bedrock, vLLM, 커스텀 엔드포인트에 대해 가이드 폼으로 모델 설정 및 검증
  • 실시간 실행 스트리밍 및 비용 추적: 노드별 진행 상황, 토큰 사용량, 레이턴시, 비용을 Execution 패널에서 실시간 모니터링하고 .executions/ 디렉토리에 저장
  • 코드 검사 패널: 생성되는 YAML/JSON 아티팩트를 확인하고 task/examples/ 디렉토리에 저장되는 동일한 형식의 파일 확인 가능

Impact

아티클에 정량적 수치가 명시되지 않았음.

Key Takeaway

비주얼 워크플로우 빌더는 복잡한 데이터 파이프라인의 설정과 실행을 선언적 설정 파일에서 그래프 기반 UI로 전환하면서, 내부적으로는 동일한 구성 아티팩트(YAML/JSON)를 자동 생성하도록 설계함으로써 학습 곡선을 낮추고 디버깅 가능성을 높일 수 있다.


합성 데이터 생성 파이프라인을 구축하는 팀에서 Studio의 비주얼 캔버스를 활용하면, 프롬프트 작성 시 {변수명} 입력 시 자동 제안되는 변수 힌트로 타이핑 오류를 줄이고, 노드 실행 후 즉시 결과를 확인하며, 구조화된 출력 스키마를 Pydantic 매핑으로 정의할 수 있어 수동 YAML 편집 대비 구성 검증 반복 주기를 단축할 수 있다.

원문 읽기