Auto-regressive LLM의 Reversal Curse 식별 및 GPT-4 정답률 79% vs 33% 격차 확인

The Reversal Curse: LLMs trained on "A is B" fail to learn "B is A"

2026년 6월 23일2분advanced

AI 요약

Context

Auto-regressive LLM이 학습 데이터의 단방향 관계를 학습하는 구조적 한계 노출. 'A is B' 형태의 데이터 학습 후 'B is A' 관계를 추론하지 못하는 일반화 실패 현상 발생.

Auto-regressive LLM은 관계의 대칭성을 자동으로 학습하지 못하므로 데이터셋 설계 시 양방향 관계를 명시적으로 포함하는 전략적 구성 필요.

실천 포인트

1. Knowledge Graph 기반 데이터셋 구축 시 A->B와 B->A 관계를 모두 포함했는지 검토

2. 모델의 추론 능력 평가 시 관계 역전(Reversal) 테스트 케이스 추가

3. 복잡한 관계 학습을 위해 In-context Examples를 통한 가이드 제공 고려

태그