由于此商品库存有限,请在下单后15分钟之内支付完成,手慢无哦!
100%刮中券,最高50元无敌券,券有效期7天
活动自2017年6月2日上线,敬请关注云钻刮券活动规则更新。
如活动受政府机关指令需要停止举办的,或活动遭受严重网络攻击需暂停举办的,或者系统故障导致的其它意外问题,苏宁无需为此承担赔偿或者进行补偿。
音像Python深度强化学习:基于Chainer和OpenAIGym
¥ ×1
译者序<br/>前言<br/>章 引言 1<br/>1.1 深度强化学习可以做什么 1<br/>1.2 本书的结构 4<br/>1.3 框架:Chainer和ChainerRL 6<br/>1.4 Python的运行检查 6<br/>1.5 Chainer的安装 9<br/>1.6 ChainerRL的安装 12<br/>1.7 模拟器:OpenAI Gym 14<br/>第2章 深度学习 17<br/>2.1 什么是深度学习 17<br/>2.2 神经网络 18<br/>. 基于Chainer的神经网络 21<br/>..1 Chainer与神经网络的对应 24<br/>..2 Chainer程序 25<br/>.. 参数设置 26<br/>..4 创建数据 27<br/>..5 定义神经网络 27<br/>.. 各种声明 28<br/>.. 显示训练状态 28<br/>.. 保存训练状态 31<br/>.. 执行训练 32<br/>2.4 与神经网络的对应 32<br/>2.4.1 感知器 32<br/>2.4.2 5层神经网络(深度学习) 33<br/>2.4.3 计算输入中的1的数量 34<br/>2.5 基于深度神经网络的手写数字识别 35<br/>2.5.1 手写数字的输入格式 36<br/>2.5.2 深度神经网络的结构 39<br/>2.5.3 8×8的手写数字数据 41<br/>2.6 基于卷积神经网络的手写数字识别 43<br/>2.6.1 卷积 45<br/>2.6.2 激活函数 49<br/>2.6.3 池化 49<br/>2.6.4 执行 50<br/>2.7 一些技巧 53<br/>2.7.1 读取文件数据 54<br/>2.7.2 使用训练模型 55<br/>2.7.3 重启训练 56<br/>2.7.4 检查权重 56<br/>2.7.5 从文件中读取手写数字 57<br/>第3章 强化学习 59<br/>3.1 什么是强化学习 59<br/>3.1.1 有监督学习 60<br/>3.1.2 无监督学习 60<br/>3.1.3 半监督学习 60<br/>3.2 强化学习原理 61<br/>3.3 通过简单的示例来学习 61<br/>3.4 应用到学习问题中 63<br/>3.4.1 状态 63<br/>3.4.2 行动 63<br/>3.4.3 奖励 63<br/>3.4.4 值 64<br/>3.5 使用Python进行训练 67<br/>3.5.1 运行程序 67<br/>3.5.2 说明程序 69<br/>3.6 基于OpenAI Gym的倒立摆 73<br/>3.6.1 运行程序 73<br/>3.6.2 说明程序 74<br/>3.7 如何保存和加载值 79<br/>第4章 深度强化学习 81<br/>4.1 什么是深度强化学习 81<br/>4.2 对于鼠学问题的应用 83<br/>4.2.1 运行程序 83<br/>4.2.2 说明程序 85<br/>4.. 如何保存和读取智能体模型 91<br/>4.3 基于OpenAI Gym的倒立摆 91<br/>4.3.1 运行程序 91<br/>4.3.2 说明程序 92<br/>4.4 基于OpenAI Gym的太空侵略者 97<br/>4.5 基于OpenAI Gym的颠球 99<br/>4.5.1 运行程序 101<br/>4.5.2 说明程序 102<br/>4.6 对战游戏 109<br/>4.6.1 黑白棋 109<br/>4.6.2 训练方法 111<br/>4.6.3 变更盘面 121<br/>4.6.4 黑白棋实体 121<br/>4.6.5 如何与人类对战 1<br/>4.6.6 卷积神经网络的应用 127<br/>4.7 使用物理擎行模拟 128<br/>4.7.1 物理引擎 129<br/>4.7.2 运行程序 130<br/>4.7.3 说明程序 131<br/>4.8 物理引擎在颠球问题中的应用 132<br/>4.9 物理引擎在倒立摆问题中的应用 140<br/>4.10 物理引擎在机械臂问题中的应用 144<br/>4.11 使用深度强化学习方法 151<br/>4.11.1 深度强化学习的类型 151<br/>4.11.2 将训练方法更改为DDN 153<br/>4.11.3 将训练方法更改为PER-DN 153<br/>4.11.4 将训练方法更改为DDPG 153<br/>4.11.5 将训练方法更改为A3C 155<br/>第5章 实际环境中的应用 157<br/>5.1 使用摄像机观察环境(MNIST) 157<br/>5.1.1 摄像机设置 158<br/>5.1.2 通过卷积神经网络对摄像机图像进行分类 160<br/>5.1.3 使用图像大小为28×28的手写数字进行训练 163<br/>5.2 实际环境中的鼠学问题 164<br/>5.3 使用Raspberry Pi处理鼠学问题 168<br/>5.3.1 环境构建 169<br/>5.3.2 以输入输出为重点的简化 169<br/>5.3.3 使用摄像机测量环境 176<br/>5.4 使用Arduino + PC处理鼠学问题 181<br/>5.4.1 环境构建 182<br/>5.4.2 以输入输出为重点的简化 185<br/>5.4.3 使用摄像机测量环境 193<br/>5.5 使用Raspberry Pi + Arduino处理鼠学问题 197<br/>5.6 结语 201<br/>附录 202
亲,大宗购物请点击企业用户渠道>小苏的服务会更贴心!
亲,很抱歉,您购买的宝贝销售异常火爆让小苏措手不及,请稍后再试~
非常抱歉,您前期未参加预订活动,
无法支付尾款哦!
抱歉,您暂无任性付资格