피드로 돌아가기
Show GN: 한국 주식시장 뉴스 분석 및 투자 리서치를 위해 특화된 7B 파라미터 에이전트 LLM
GeekNewsGeekNews
AI/ML

Show GN: 한국 주식시장 뉴스 분석 및 투자 리서치를 위해 특화된 7B 파라미터 에이전트 LLM

VELA 모델이 DPO 기반 language leak 교정으로 한국 증시 특화 7B 에이전트 LLM을 구현하다

unohee2026년 3월 31일1intermediate

Context

기존 금융 LLM은 한국 시장 용어에서 할루시네이션이 발생했다. 응답 중간에 중국어나 영어로 전환되는 language leak 문제도 존재했다.

Technical Solution

  • VELA → Qwen2.5-7B-Instruct 베이스에 SFT + DPO 파이프라인으로 파인튜닝 수행
  • SFT 단계 → 36,713 샘플과 2,135 종목 기반 뉴스 분류와 시그널 분석 학습
  • DPO 단계 → 24,779 페어로 Chinese Leak 제거 및 Reasoning Trace 형식 정렬
  • Reasoning Trace → search, analyze, confidence 단계의 JSON 형식 사고 과정 출력
  • Synthesis Report → 7섹션 리서치 포맷(요약, 지표, 수급, 뉴스 영향, 리스크, 투자 의견)

Impact

RTX 3060 12GB 기준 Q4_K_M 양자화 시 36 tok/s 속도와 4.4GB 용량으로 Chinese Leak 0/5 달성. Q8_0 양자화 시 25 tok/s 속도와 7.6GB 용량으로 Chinese Leak 0/5 달성.

Key Takeaway

domain-specific LLM은 범용 모델의 특화된 문제(language leak)를 DPO로 집중 교정하는 것이 효과적이다.


한국 증시 분석 시스템에서 외부 API 실시간 시세를 추론 레이어 아래에 배치하고 VELA를 그 위에서 동작시키는 구조로 설계 시 실시간性与추론 품질을 동시에 확보할 수 있다

원문 읽기