由于此商品库存有限,请在下单后15分钟之内支付完成,手慢无哦!
100%刮中券,最高50元无敌券,券有效期7天
活动自2017年6月2日上线,敬请关注云钻刮券活动规则更新。
如活动受政府机关指令需要停止举办的,或活动遭受严重网络攻击需暂停举办的,或者系统故障导致的其它意外问题,苏宁无需为此承担赔偿或者进行补偿。
[正版新书] 动态规划与最优控制——近似动态规划(第I卷) 德梅萃·P. 博塞克斯 清华大学出版社 动态规 划-教材
¥ ×1
书名: | 动态规划与最优控制——近似动态规划(第I卷) |
出版社: | 清华大学出版社 |
出版日期 | 2024 |
ISBN号: | 9787302659716 |
本书系统性介绍动态规划与最优控制,包括动态规划算法、确定性系统与随机最短路问题、确定性连续时间最优控制、状态信息完整的问题、状态信息缺失的问题、次优与适应控制、无穷阶段问题等。 |
贾庆山,清华大学自动化系副教授,2002年和2006年分别于清华大学自动化系获工学学士、博士学位,同年留校任教。2006、2010、2013年分别任美国哈佛大学、香港科技大学、美国麻省理工学院访问学者。作为负责人先后承担国家自然科学基金青年基金、面上项目、优秀青年基金,参加国家自然科学基金重点项目、重大研究计划培育项目和集成项目。承担多个国际合作项目。任IEEE Transactions on Automation Science and Engineering、Discrete Event Dynamic Systems - Theory and Applications等国际期刊副编辑,IIE Transactions领域编辑。发表国际期刊论文和国际会议论文逾八十篇,合著英文专著一部,合编英文专著一部,合译教材一本。 |
|
本书是MIT博塞克斯教授的一本力作,分两卷,本书是第I卷,主要介绍动态规划与最优控制的基本方法,包括最短路径问题、精确和不精确状态信息、有限与无限阶段问题等经典模型,以及近似动态规划等理论方法。本书体现了博塞克斯教授著作的一贯的特点,深入浅出,适于自学,相信读者会有愉快的阅读与学习体验。
|
|
目录
第 1章动态规划算法 1
1.1概述 .. 1
1.2基本问题 . 8
1.3算法 .12
1.4状态增广和其他重新建模 .24
1.5一些数学问题 ..29
1.6动态规划和极小化极大控制 32
1.7注释、参考文献和习题 .35
第 2章确定性系统和最短路径问题 44
2.1有限状态系统和最短路径 .44
2.2一些最短路径的应用 .47
2.2.1关键路径分析 .47
2.2.2隐马尔可夫模型和瓦特比算法 ..48
2.3最短路径算法 ..53
2.3.1标签纠正方法 .55
2.3.2标签纠正变形-A*算法 60
2.3.3分支定界 ..61
2.3.4约束与多目标问题 63
2.4注释、参考文献和习题 .67
第 3章确定性连续时间最优控制 72
3.1连续时间最优控制 ..72
3.2哈密尔顿-雅可比-贝尔曼方程 .74
3.3庞特里亚金最小值原理 .79
3.3.1使用 HJB方程的非正式推导 79
3.3.2一种基于变分思想的推导 ..86
3.3.3离散时间问题的最小值原理 ..89
3.4最小值原理推广 ..90
3.4.1固定的末端状态 .91
3.4.2自由初始状态 .93
3.4.3自由终止时间 .94
3.4.4时变系统与费用 .97
动态规划与最优控制——近似动态规划 (第 I卷) 3.4.5奇异问题 ..97
3.5注释、参考文献和习题 .99
第 4章具有精确状态信息的问题 . 103
4.1线性系统和二次型费用 .. 103
4.2库存控制 . 112
4.3动态资本分析 119
4.4最优停止问题 122
4.5调度与交换的理由 130
4.6不确定性的集合隶属度描述 . 133
4.6.1集合隶属度估计 .. 133
4.6.2具有未知且有界扰动的控制 138
4.7注释、参考文献和习题 .. 140
第 5章不精确状态信息的问题 .. 152
5.1化简为精确信息的情形 .. 152
5.2线性系统和二次型费用 .. 160
5.3线性系统的最小方差控制 .. 165
5.4充分统计量 . 176
5.4.1条件状态分布 .. 177
5.4.2有限状态系统 .. 180
5.5注释、参考文献和习题 .. 190
第 6章近似动态规划 198
6.1确定性等价和自适应控制 .. 199
6.1.1谨慎、探测和对偶控制 . 203
6.1.2两阶段控制和识别能力 . 204
6.1.3确定性等价控制和可辨识性 205
6.1.4自调节调节器 .. 209
6.2开环反馈控制 210
6.3有限前瞻策略 213
6.3.1有限前瞻策略的性能界 . 214
6.3.2有限前瞻中的计算问题 . 217
6.3.3问题近似——强化分解 . 219
6.3.4集结 223
6.3.5后续费用的参数化近似 . 227
6.4滚动算法 . 234
6.4.1离散确定性问题 .. 239
6.4.2由仿真评价的 Q-因子 .. 251
目录 IX 6.4.3 Q-因子近似 .. 253
6.5模型预测控制及相关方法 .. 255
6.5.1滚动时段近似 .. 255
6.5.2模型预测控制中的稳定性问题 257
6.5.3结构受限的策略 .. 262
6.6近似动态规划中的额外主题 . 266
6.6.1离散化 266
6.6.2其他近似方法 .. 268
6.7注释、参考文献和习题 .. 269
第 7章无限阶段问题介绍 .. 280
7.1概览 .. 280
7.2随机最短路径问题 282
7.3折扣问题 . 290
7.4每阶段平均费用问题 .. 293
7.5半马尔可夫问题 303
7.6注释、参考文献和习题 .. 310
附录 A数学知识复习 320
A.1集合 . 320
A.2欧氏空间 321
A.3矩阵 . 321
A.4分析 . 324
A.5凸集和凸函数 .. 325
附录 B优化理论 . 327
B.1最优解 . 327
B.2最优性条件 328
B.3二次型最小化 329
附录 C概率论 . 330
C.1概率空间 330
C.2随机变量 330
C.3条件概率 331
附录 D关于有限状态马尔可夫链 .. 333
D.1平稳马尔可夫链 .. 333
D.2状态分类 334
D.3极限概率 334
动态规划与最优控制——近似动态规划 (第 I卷) D.4首达时间 335
附录 E卡尔曼滤波 . 336
E.1最小二乘估计 336
E.2线性最小二乘估计 .. 337
E.3状态估计——卡尔曼滤波器 . 342
E.4稳定性方面 346
E.5高斯-马尔可夫估计器 . 347
E.6确定性最小二乘估计 .. 349
附录 F随机线性系统模型 351
F.1具有随机输入的线性系统 . 351
F.2具有有理数谱的过程 .. 352
F.3 ARMAX模型 .. 353
附录 G不确定性下的决策问题建模 . 354
G.1不确定性下的决策问题 . 354
G.2期望效用理论和风险 . 357
G.3随机最优控制问题 .. 365
参考文献 369
|
|
亲,大宗购物请点击企业用户渠道>小苏的服务会更贴心!
亲,很抱歉,您购买的宝贝销售异常火爆让小苏措手不及,请稍后再试~
非常抱歉,您前期未参加预订活动,
无法支付尾款哦!
抱歉,您暂无任性付资格