Hacker NewsBellman이 1952년 제안한 동적 프로그래밍의 HJB 방정식이 1840년대 물리학의 Hamilton-Jacobi 방정식과 동일한 구조를 가짐을 발견하여 강화학습과 확산 모델을 자연스럽게 연결한다Hamilton-Jacobi-Bellman Equation: Reinforcement Learning and Diffusion ModelsAI/MLadvanced55 분 소요2026년 3월 30일