由于此商品库存有限,请在下单后15分钟之内支付完成,手慢无哦!
100%刮中券,最高50元无敌券,券有效期7天
活动自2017年6月2日上线,敬请关注云钻刮券活动规则更新。
如活动受政府机关指令需要停止举办的,或活动遭受严重网络攻击需暂停举办的,或者系统故障导致的其它意外问题,苏宁无需为此承担赔偿或者进行补偿。
音像边做边学深度强化学习 PyTorch程序设计实践(日)小川雄太郎
¥ ×1
译者序
前言
章 强化学习概述1
1.1 机器学习的分类(监督学习、非监督学习、强化学习)1
1.2 强化学习、深度强化学习的历史6
1.3 深度强化学习的应用实例11
参考文献14
第2章 在走迷宫任务中实现强化学习16
2.1 Try Jupyter的使用方法16
2.2 迷宫和智能体的实现
. 策略迭代法的实现31
2.4 价值迭代的语整理41
2.5 Sarsa的实现46
2.6 实现学习2
参考文献57
第3章 在倒立摆任务中实现强化学习59
3.1 在本地PC上准备强化学习的实现和执行环境59
3.2 倒立摆任务“CartPole”64
3.3 由多变量连续值表示的状态的表格表示69
3.4 学习的实现72
参考文献80
第4章 使用PyTorch实现深度学习81
4.1 神经网络和深度学习的历史81
4.2 深度学习的计算方法89
4.3 使用PyTorch实现MNIST手写数字分类任务94
参考文献107
第5章 深度强化学习DN的实现108
5.1 深度强化学习DN(深度网络)的说明108
5.2 实现DN的四个要点111
5.3 实现DN(上) 113
5.4 实现DN(下) 1
参考文献127
第6章 实现深度强化学习的改进版128
6.1 深度强化学习算法发展图128
6.2 DDN的实现132
6.3 Dueling Network的实现141
6.4 优先经验回放的实现145
6.5 A2C的实现157
参考文献168
第7章 在AWS GPU环境中实现消砖块游戏169
7.1 消砖块游戏“Breakout”的描述169
7.2 准备在AWS上使用GPU所需要的深度学习执行环境174
7.3 学习Breakout的四个关键思想187
7.4 A2C的实现(上) 193
7.5 A2C的实现(下) 203
参考文献212
后记214
亲,大宗购物请点击企业用户渠道>小苏的服务会更贴心!
亲,很抱歉,您购买的宝贝销售异常火爆让小苏措手不及,请稍后再试~
非常抱歉,您前期未参加预订活动,
无法支付尾款哦!
抱歉,您暂无任性付资格