RAG와 Agentic Workflow 결합을 통한 LLM Hallucination 제거 및 데이터 무결성 확보

Define the state of our agent

Maria jose Gonzalez Antelo2026년 6월 14일8분intermediate

AI 요약

Context

단일 Prompt 기반의 LLM 설계로 인한 Context Window Saturation 및 데이터 조작(Confabulation) 발생. 특히 HR 도메인 특성상 자격 요건 오판단 등 작은 Hallucination이 서비스 신뢰도에 치명적인 영향을 주는 구조적 한계 노출.

Technical Solution

Pinecone Vector DB 기반 RAG 파이프라인 구축을 통한 불필요한 컨텍스트 제거 및 검색 효율 최적화
PDF 데이터를 단순 글자 수가 아닌 Experience, Skills 등 의미 단위로 분리하는 Semantic Chunking 적용
LangGraph를 활용하여 Plan $\rightarrow$ Retrieve $\rightarrow$ Synthesize $\rightarrow$ Verify $\rightarrow$ Refine 단계의 Cyclic Graph 설계
LLM을 데이터베이스가 아닌 Reasoner로 정의하고, 생성된 결과물을 원본 데이터와 대조하는 Verify-facts Critic 노드 배치
단방향 추론 구조에서 탈피하여 오류 발견 시 이전 단계로 회귀하는 Iterative Loop 구현을 통한 팩트 체크 자동화

실천 포인트

- LLM의 첫 번째 출력물을 신뢰하지 않는 Verification Loop 설계 여부 검토 - 단순 Character-based Split 대신 도메인 지식 기반의 Semantic Chunking 전략 수립 - Prompt에 모든 데이터를 주입하는 방식 대신 Vector DB를 활용한 최적 컨텍스트 추출 구조 적용 - 생성 결과와 검색 소스 간의 모순을 탐지하는 별도의 Critic LLM 노드 구성

태그

#RAG #Vector Database #LangGraph #Agentic Workflow #Hallucination

원문 읽기