- 商品参数
-
- 作者:
张智聪著|
无编
- 出版社:科学出版社
- 页数:232页
- 开本:16开
- ISBN:9787030492890
- 版权提供:科学出版社
内容介绍
增强学习是人工智能领域一种应用越来越广泛的机器学习算法。本书对增强学习的基本原理、主要经典算法及其在制造系统调度领域若干问题的应用进行阐述。主要内容包括:Sarsa(λ, k)增强学习算法等增强学习算法的介绍及相关理论证明;增强学习架构及面向生产调度问题的增强学习模型构建方式;流水车间调度问题、平行机调度问题、半导体测试调度问题等制造系统调度问题与自组织型排队网络调度问题的增强学习模型及解决方案;增强学习在以上调度问题应用的实验结果及相关分析等。
目录
目录
前言
第1章 绪论1
1.1增强学习基本原理1
1.1.1马尔可夫决策过程1
1.1.2增强学习系统2
1.1.3增强学习算法的分类与发展概述4
1.2增强学习算法应用引例——最短路问题7
1.3增强学习算法在调度领域的应用研究20
1.4本书组织结构22
第2章 增强学习算法23
2.1经典的增强学习算法23
2.1.1TD/TD(λ)学习算法23
2.1.2Q学习24
2.1.3Sarsa算法24
2.1.4R学习25
2.2Sarsa(λ,k)算法26
2.2.1Sarsa(λ,k)算法的基本原理26
2.2.2前视与后视Sarsa(λ,k)算法29
2.2.3Sarsa(λ,k)算法的性质34
2.3SMDP型Sarsa(λ,k)算法40
2.4多维行为的增强学习算法44
2.5一种自适应步长的增强学习算法46
第3章 流水车间调度问题49
3.1问题描述49
3.2流水车间调度问题的增强学习模型49
3.2.1系统状态表示49
3.2.2行为51
3.2.3报酬函数54
3.3结合线性函数泛化器的TD(λ)算法及实验结果55
3.3.1结合线性函数泛化器的TD(λ)算法55
3.3.2实验结果57
第4章 平行机调度问题60
4.1最小化加权平均流程时间的离线平行机调度60
4.1.1问题描述60
4.1.2增强学习模型61
4.1.3实验结果66
4.2最小化加权平均误工时间的离线平行机调度68
4.2.1问题描述68
4.2.2增强学习建模69
4.2.3实验结果75
4.3最小化加权平均流程时间的在线平行机调度79
4.3.1问题描述79
4.3.2增强学习模型79
4.3.3实验结果83
4.4最小化加权平均误工时间的在线平行机调度85
4.4.1问题描述85
4.4.2增强学习模型85
4.4.3求解变速机调度问题的R学习90
4.4.4实验结果92
第5章 半导体测试调度问题98
5.1半导体测试调度问题描述98
5.2关于半导体测试调度的研究103
5.2.1附加资源充足的半导体测试调度103
5.2.2附加资源受限的半导体测试调度104
5.2.3和半导体测试调度相关的调度问题107
5.2.4小结109
5.3整数规划模型109
5.3.1符号定义110
5.3.2决策变量110
5.3.3目标函数和约束111
5.3.4问题性质分析113
5.4半导体测试调度问题的增强学习模型113
5.4.1状态变量及状态转移机制115
5.4.2行为118
5.4.3报酬函数129
5.5结合函数泛化器的Sarsa(λ,k)算法132
5.5.1径向基神经网络函数泛化器132
5.5.2神经网络的构造134
5.5.3函数泛化器的权重更新法则135
5.5.4结合径向基神经网络函数泛化器的Sarsa(λ,k)算法136
5.6演示算例139
5.7参数设置与函数泛化器性能分析146
5.7.1行为选择147
5.7.2参数设置147
5.7.3函数泛化器性能分析154
5.8半导体测试调度实验结果与分析157
5.8.1与工业方法及各行为策略对比157
5.8.2与其他增强学习算法对比159
5.8.3与能力约束调度方法对比161
5.9讨论162
5.10可重构制造系统调度163
5.10.1具有可重构特性的调度系统机制1…
5.10.2增强学习模型架构168
第6章 排队网络控制问题173
6.1多服务台排队系统控制的半马尔可夫决策模型173
6.1.1问题描述174
6.1.2半马尔可夫决策模型建模174
6.1.3排队控制系统的性质180
6.1.4数值例子187
6.2自组织型排队网络控制问题189
6.2.1自组织型排队网络控制问题描述191
6.2.2自组织型排队网络控制问题的增强学习模型193
6.2.3解决自组织型排队网络控制问题的增强学习算法197
第7章 结束语201
参考文献205
其他参考文献216
在线试读
暂无试读
1