浅谈动态规划
什么是动态规划?
动态规划 算法是解决 多阶段决策过程最优 的通用方法。在这类问题中,可能有多个可行解。每一个解都对应着一个值,而我们希望找到的是最优值的解。
要了解动态规划的概念,首先要知道什么是多阶段决策问题。
1.多阶段决策问题
如果一类活动过程可以分为若干个相互联系的阶段 ,在每一个阶段都需做出决策(采取措施),一个阶段的决策确定以后,常常影响到下一个阶段的决策,从而就完全地确定了一个过程的活动路线,则称它为多阶段决策问题。
2.策略
各个阶段的决策构成一个决策序列,称为一个策略。每一个阶段都有若干个决策可供选择,因而就有许多策略供我们选取,对应于一个策略可以确定活动的效果,这个效果可以用数量来确定。策略不同,效果也会有所不同。多阶段决策问题,就是要在可以选择的策略之间,选取一个最优策略,使在预定的标准下达到最好的效果。
举个例子:最短路径问题求解
求 到达 的最短距离。
思考:仔细观察本图路径的特殊性,可以分成四个阶段。第一阶段 :
有两条通路: 和 ;第二阶段 :
有三条通路: , , ;
有两条通路: , ;第三阶段 :
有两条通路: 和 ;
有一条通路:;
有一条通路:;
有一条通路:;第四阶段 : 有一条通路:;
有一条通路:;
有一条通路:.解决方法:倒着推 (设 表示 点到 点的最短路径的长度)
不难想到:
名词解释: 我们把 称为当前 x 的状态;每一的阶段的选择依赖于当前的状态,又随即引起状态的转移;一个决策序列就是在变化的状态中产生的,故有“动态”的含义。
3.小结
三个基本的概念 |
---|
1.阶段: 问题的过程被分成若干个相互联系的部分,我们称之为阶段,以便按一定的次序求解。 |
2.状态: 某一阶段的出发位置称为状态,通常一个阶段包含着若干个状态。 |
3.决策: 对问题的处理中做出的每种选择的行动就是决策。即从该阶段的每个状态出发,通过一次选择性的行动移至下一个阶段的相应状态。 |
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 WANGYUYAO!