动态规划是运筹学的一个分支,是求解决策过程最优化的数学方法。
动态规划是求解某类问题的一种方法,而不是一种特殊算法,没有标准的数学表达式和明确定义的一组规则。
动态规划的基本概念有:
阶段:对整个过程的自然划分,阶段变量一般用
表示; 状态:每个阶段开始时过程所处的自然状况,用
表示第 阶段的状态变量,用 表示第 阶段的允许状态集合; 决策:一个阶段的状态确定后,作出各种选择从而演变到下一阶段的某个状态,用
表示第 阶段处于状态 时的决策变量,用 表示 的允许决策集合; 策略:决策组成的序列。由第
到第 阶段的子过程策略记 状态转移方程:表示状态和决策确定下一状态的演变规律,记
指标函数:衡量过程优劣的数量指标,记
最优值函数:使指标函数达到最优,记
其中 可取 或 。