本文介绍: 本文仅供学习使用B站:DR_CAN。
1. 基本概念
Richoard Bell man 最优化理论:
An optimal policy has the property that whatever the initial state and initial decision are, the remaining decisions must constitude an optimal policy with regard to the state resulting from the first decision.
——动态Dynamic 面向未来
2. 代码详解
3. 简单一维案例
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。