피드로 돌아가기
Hacker NewsAI/ML
원문 읽기

Auto-regressive LLM의 Reversal Curse 식별 및 GPT-4 정답률 79% vs 33% 격차 확인
The Reversal Curse: LLMs trained on "A is B" fail to learn "B is A"
AI 요약
Context
Auto-regressive LLM이 학습 데이터의 단방향 관계를 학습하는 구조적 한계 노출. 'A is B' 형태의 데이터 학습 후 'B is A' 관계를 추론하지 못하는 일반화 실패 현상 발생.
Technical Solution
- Auto-regressive Token Prediction 방식에 따른 순차적 정보 처리의 한계 분석
- Fictitious Statements 기반 Finetuning을 통한 모델 규모 및 Family별 일반화 능력 검증
- In-context Learning 환경에서의 역방향 관계 추론 가능성 확인을 통한 학습 단계의 결함 증명
- Data Augmentation 적용 후에도 지속되는 Reversal Curse의 견고함 확인
- 실제 유명인 관계 데이터를 통한 GPT-4의 방향성 의존적 추론 성능 정밀 측정
Impact
- GPT-4 기준 정방향 질문 정답률 79% 대비 역방향 질문 정답률 33% 기록
- 모델 크기 및 데이터 증강 여부와 관계없이 일관된 일반화 실패 패턴 확인
Key Takeaway
Auto-regressive LLM은 관계의 대칭성을 자동으로 학습하지 못하므로 데이터셋 설계 시 양방향 관계를 명시적으로 포함하는 전략적 구성 필요.
실천 포인트
1. Knowledge Graph 기반 데이터셋 구축 시 A->B와 B->A 관계를 모두 포함했는지 검토
2. 모델의 추론 능력 평가 시 관계 역전(Reversal) 테스트 케이스 추가
3. 복잡한 관계 학습을 위해 In-context Examples를 통한 가이드 제공 고려