피드로 돌아가기
Database vendors pitch themselves as the cure for runaway AI costs
The RegisterThe Register
Database

토큰 소모 최적화를 위한 Knowledge Layer 중심의 Agentic AI 아키텍처 전환

Database vendors pitch themselves as the cure for runaway AI costs

2026년 6월 24일8advanced

Context

AI Agent가 데이터 구조를 매번 재탐색하는 Exploratory Work로 인한 과도한 Token 소모와 비용 증가 발생. 기존의 Operational Store와 Vector Index 중심 설계는 루프 기반의 소프트웨어 작동 방식보다 인간의 단순 조회에 최적화된 구조적 한계 존재.

Technical Solution

  • 단순 Retrieval을 넘어 데이터 구조와 콘텐츠를 사전 컴파일하는 Knowledge Engine(Nexus) 도입
  • Agent 요청 전 단계에서 특화된 Context를 미리 생성하는 Derived Artifacts 설계로 추론 반복 제거
  • SQL, PDF 등 이기종 데이터 소스를 기반으로 Task-specific Context를 생성하는 Semantic Layer 구축
  • Query Layer 내에 Budget Primitive를 포함한 KnowQL을 도입하여 토큰 사용량과 비용을 직접 제어
  • 데이터 탐색 과정을 Upstream에서 한 번만 수행하고 재사용 가능한 형태로 저장하는 구조적 최적화

1. Agent가 동일한 스키마 탐색이나 데이터 구조 파악을 반복하는지 모니터링하십시오.

2. 런타임 추론 비용을 낮추기 위해 정적/반정적 Context를 생성하는 캐싱 레이어 도입을 검토하십시오.

3. LLM 호출 비용을 인프라 설계 제약 사항(Design Constraint)으로 설정하고 쿼리 단계에서 예산 제어 로직을 구현하십시오.

4. 다양한 페르소나(예: 재무 vs 인사)에 따라 동일 데이터라도 서로 다른 Context Artifact를 제공하는 설계를 적용하십시오.

원문 읽기