피드로 돌아가기
The Daimon Java SDK: Chat, Stream, and Query Memory from 3 Lines of Java
Dev.toDev.to
AI/ML

Go Sidecar 기반 추상화로 Java LLM 통합 비용 제로화

The Daimon Java SDK: Chat, Stream, and Query Memory from 3 Lines of Java

Rishi Kumar2026년 5월 17일7intermediate

Context

Java 환경에서 LLM 도입 시 HTTP 클라이언트 설정, SSE 파싱, 세션 관리 등 반복적인 보일러플레이트 코드 발생. 다양한 LLM Provider 교체 시마다 SDK 의존성을 변경해야 하는 강한 결합도 문제 존재.

Technical Solution

  • Go 기반 Sidecar 아키텍처 도입을 통한 LLM 오케스트레이션 레이어 분리
  • YAML 설정 기반의 인프라 정의로 Java 코드 수정 없는 Provider 및 Vector DB 교체 구조 설계
  • Sidecar-App 간 Localhost HTTP 통신을 통한 SDK 복잡도 제거 및 인터페이스 단일화
  • Memory Store 설정을 통한 RAG 파이프라인의 Sidecar 내재화로 자동 컨텍스트 주입 구현
  • Lazy Iterable 기반의 SSE 처리 방식으로 Java 애플리케이션의 스레드 관리 부담 최소화
  • Redis 및 Postgres 기반의 외부 Session Store 연동을 통한 상태 저장소 확장성 확보

- LLM Provider 종속성을 제거하기 위해 인터페이스 추상화 계층(Sidecar 등) 도입 검토 - RAG 구현 시 애플리케이션 레벨이 아닌 인프라 레벨에서 Context Injection 자동화 가능 여부 확인 - SSE 스트리밍 데이터 처리 시 Callback 방식 대신 Lazy Iterable 구조를 통한 단순화 적용

원문 읽기