피드로 돌아가기
A Picture Is Worth a Thousand Tokens
Dev.toDev.to
AI/ML

텍스트 프롬프트 한계를 극복한 Reference Image 기반 AI 디자인 제어 전략

A Picture Is Worth a Thousand Tokens

Ben Shumaker2026년 4월 14일8intermediate

Context

LLM 기반 웹 생성 시 모델이 특정 시각적 패턴에 수렴하는 Default Aesthetic 현상 발생. Design System 도입이나 세부 지침 제공만으로는 레이아웃 및 구성의 반복적인 정체 상태를 해결하는 데 한계 노출.

Technical Solution

  • Design System 적용을 통한 기본 색상 및 폰트 제약 조건 설정으로 최소 품질 하한선 확보
  • Custom Instructions 기반의 Design Thinking 프롬프트 주입으로 일반적인 AI 스타일 배제 유도
  • 텍스트 대비 고대역폭 정보원인 Reference Image를 입력값으로 사용하여 레이아웃 및 공간 구성의 다양성 확보
  • 이미지 내에 인코딩된 수백 개의 미세 결정 사항(Spacing, Color Relationship)을 모델이 직접 추출하도록 설계
  • 유연성과 품질 사이의 Trade-off 최적화를 위해 스타일 라이브러리와 Code Sample을 결합한 하이브리드 제어 방식 채택

- AI 모델의 기본값 수렴을 막기 위해 텍스트 설명 대신 고해상도 스크린샷을 Reference로 제공할 것 - 단순한 형용사(예: Premium, Modern) 사용을 지양하고 구체적인 시각적 예시 데이터를 입력값으로 구성할 것 - 고정된 Design System과 가변적인 Reference Image를 조합하여 일관성과 독창성을 동시에 확보할 것

원문 읽기