LoRA SFT 기반 Delta A +0.263 달성 및 암기 vs 일반화 검증 분석

Did My LoRA Learn Tenacious Style—or Just Memorize Augmented Patterns?

Beamlaka2026년 5월 7일3분advanced

AI 요약

Context

B2B 세일즈 이메일 스타일 학습을 위해 LoRA 기반 Supervised Fine-Tuning(SFT)을 수행함. 학습 데이터의 94.3%가 128개 원본의 증강 데이터로 구성되어 표면적 패턴 암기로 인한 성능 왜곡 가능성이 존재하는 상황임.

실천 포인트

1. 증강 데이터 사용 시 원본-변형 쌍을 동일한 Split에 배치하는 Grouped Holdout 적용 여부 확인

2. LoRA 모듈별(Attention vs MLP) Gradient Norm을 측정하여 학습 압력이 어디에 집중되었는지 분석

3. 단순 Loss 감소와 벤치마크 상승을 일반화된 성능 향상과 동일시하지 않고 별도의 진단 지표 설정

태그