피드로 돌아가기
Show GN: Athena - AI에게 가짜 한국인 5천명을 투표시켜본 실험 (2026 지방선거 시도지사)
GeekNewsGeekNews
AI/ML

Show GN: Athena - AI에게 가짜 한국인 5천명을 투표시켜본 실험 (2026 지방선거 시도지사)

Gemma 4 기반 페르소나 5,100명 시뮬레이션 통한 LLM 투표 모델 한계 검증

kimchi2026년 4월 28일1intermediate

Context

미국 LLM-as-voter 연구 방법론의 한국 정치 환경 적용 가능성 검토를 위한 시뮬레이션 수행. Nemotron-Personas-Korea 기반의 가상 페르소나와 LLM을 결합한 여론 예측 모델의 유효성 분석.

Technical Solution

  • NEC 크롤링 데이터 기반 8,300명의 후보군 확보를 통한 데이터셋 구축
  • 시도별 300명씩 총 5,100명의 페르소나 샘플링을 통한 모집단 구성
  • Gemma 4 e4b 모델을 활용한 4,800표의 투표 시뮬레이션 로직 구현
  • RTX 5060 GPU 환경에서 3시간 소요되는 추론 파이프라인 설계
  • 페르소나의 속성 라벨과 후보자 특성 간의 매칭 메커니즘 분석
  • 정보 부족 시 기권 처리 로직을 통한 응답 신뢰도 측정

Impact

  • 특정 후보(김한구)에 대한 90.5%의 편향된 투표 결과 도출
  • 충북 73%, 인천 93%에 달하는 높은 기권율 발생 확인
  • 강원(100%), 경북(99%) 등 현직 프리미엄의 과도한 가중치 적용 확인

Key Takeaway

LLM의 페르소나 시뮬레이션은 단순 라벨 매칭에 의존하는 경향이 강해 복잡한 사회적 맥락을 반영한 여론조사 대체재로 활용하기에 부적합함.


1. LLM 기반 시뮬레이션 설계 시 단순 속성 매칭(Label Matching)으로 인한 편향성 발생 여부 검토

2. 페르소나 데이터의 밀도와 LLM의 추론 결과 간의 상관관계를 정량적으로 분석

3. 도메인 특화 데이터셋(한국 정치 등) 적용 시 기존 글로벌 벤치마크 모델의 유효성 재검증

원문 읽기