피드로 돌아가기
Hacker NewsAI/ML
원문 읽기
Supervised Learning 한계 극복을 위한 Continual Backpropagation 기반 Discovery 아키텍처
Rich Sutton on AI creativity and discovery
AI 요약
Context
Generative AI의 Supervised Learning 기반 구조는 학습 데이터의 단순 모사(Mimic)에 그쳐 Novelty와 Goodness를 동시에 달성하지 못하는 한계 존재. 단순 확률적 생성(Stochastic process)으로 인한 Novelty는 정답지 기반의 Goodness와 충돌하여 Hallucinations를 유발하는 구조적 병목 발생.
Technical Solution
- Supervised Learning의 패턴 인식 한계를 넘어선 Evaluation-driven Discovery 메커니즘 도입
- AlphaGo, AlphaFold와 같이 명시적 목표(Explicit Goal)와 평가 시스템을 결합한 탐색 구조 설계
- Deterministic한 Backpropagation 과정에 Random Initialization을 통한 초기 Variation 확보
- 네트워크 학습 중 Plasticity 상실 문제를 해결하기 위한 Continual Backpropagation 알고리즘 적용
- 사용 빈도가 낮은 Neuron을 주기적으로 재초기화(Re-initialize)하여 지속적인 Variation과 Discovery 가능성 유지
- 단순 예측(Prediction)이 아닌 '생성-평가-발견'의 루프를 통한 자율적 최적화 달성
실천 포인트
- LLM의 Hallucination 억제와 창의적 발견을 구분하여, 단순 생성 task에는 Supervised Learning을, 과학적 발견 task에는 RL 기반 Evaluation 루프를 설계할 것 - 딥러닝 모델의 Catastrophic Forgetting 및 Plasticity 저하 방지를 위해 주기적인 Weight Reset 또는 Continual Learning 기법 검토 - 시스템 설계 시 '데이터 모사'와 '목표 기반 최적화'의 Trade-off를 분석하여 적절한 Learning Paradigm 선택