返回首页
苏宁会员
购物车 0
易付宝
手机苏宁

服务体验

店铺评分与同行业相比

用户评价:----

物流时效:----

售后服务:----

  • 服务承诺: 正品保障
  • 公司名称:
  • 所 在 地:
本店所有商品

  • 深度强化学习 原理、算法与PyTorch实战 微课视频版 刘全,黄志刚 编 计算机控制仿真与人工智能专业科技 正版图书籍
  • 新商品上架
    • 作者: 刘全、黄志刚著
    • 出版社: 清华大学出版社
    送至
  • 由""直接销售和发货,并提供售后服务
  • 加入购物车 购买电子书
    服务

    看了又看

    商品预定流程:

    查看大图
    /
    ×

    苏宁商家

    商家:
    句字图书专营店
    联系:
    • 商品

    • 服务

    • 物流

    搜索店内商品

    商品分类

    商品参数
    • 作者: 刘全、黄志刚著
    • 出版社:清华大学出版社
    • 开本:16开
    • ISBN:9784185709704
    • 版权提供:清华大学出版社

    深度强化学习 原理、算法与PyTorch实战 微课视频版

    作  者:刘全,黄志刚 编
    定  价:59.8
    出 版 社:清华大学出版社
    出版日期:2021年08月01日
    页  数:260
    装  帧:平装
    ISBN:9787302578208

    强化学习是目前机器学习领域最热门的方向之一,本书经多年的实践教学经验的积累,形成了一套完整的教学体系。并结合流行的深度学习框架PyTorch,该书在理论和应用上都是较优选的。本书理论结合实践,深入浅出地讲解相关算法和实例。

    第一部分:预备知识及环境安装
    第1章深度强化学习概述
    1.1引言
    1.2深度学习
    1.3强化学习
    1.4深度强化学习
    1.5小结
    1.6习题
    第2章环境的配置
    2.1PyTorch简介
    2.2PvTorch和TensorFlow
    2.3强化学习的开发环境
    2.3.1Anaconda环境搭建
    2.3.2Anaconda环境管理
    2.3.3PyTorch的安装
    2.3.4JupyterNotebook的安装
    2.3.5JupyterNotebook的使用
    2.3.6Gym的安装
    2.3.7Gym案例
    2.4小结
    2.5习题
    第二部分:表格式强化学习
    第3章数学建模
    3.1马尔可夫决策过程
    3.2基于模型与无模型
    3.3求解强化学习任务
    3.3.1策略
    3.3.2奖赏与回报
    3.3.3值函数与贝尔曼方程
    3.3.4很优策略与很优值函数
    3.4探索与利用
    3.5小结
    3.6习题
    第4章动态规划法
    4.1策略迭代
    4.1.1策略评估
    4.1.2策略迭代
    4.2值迭代
    4.3广义策略迭代
    4.4小结
    4.5习题
    第5章蒙特卡洛法
    5.1蒙特卡洛法的基本概念
    5.1.1MC的核心要素
    5.1.2MC的特点
    5.2蒙特卡洛预测
    5.3蒙特卡洛评估
    5.4蒙特卡洛控制
    5.4.1基于探索始点的蒙特卡洛控制
    5.4.2同策略蒙特卡洛控制
    5.4.3异策略与重要性采样
    5.4.4蒙特卡洛中的增量式计算
    5.4.5异策略蒙特卡洛控制
    5.5小结
    5.6习题
    第6章时序差分法
    6.1时序差分预测
    6.2时序差分控制圆
    6.2.1Sarsa算法
    6.2.2Q-Learning算法
    6.2.3期望sarsa算法
    6.3优选化偏差与DoubleQ-Learning
    6.3.1优选化偏差
    6.3.2DoubleQ-Learning
    6.3.3DoubleQ-Learning
    6.4DP、MC和TD算法的关系
    6.4.1穷举式遍历与轨迹采样
    6.4.2期望更新与采样更新
    6.5小结
    6.6习题
    第7章n-步时序差分法
    7.1.ln-步TD预测及资格迹回
    7.1.1n-步TD预测
    7.1.2前向TD(λ)算法
    7.1.3后向TD(λ)算法
    7.2n-步TD控制及其资格迹实现
    7.2.1同策略n-步Sarsa算法
    7.2.2Sarsa(λ)算法
    7.2.3异策略n-步Sarsa算法
    7.2.4n-步TreeBackup算法
    7.3小结
    7.4习题
    第8章规划和蒙特卡洛树搜索
    8.1模型、学习与规划回
    8.1.1模型
    8.1.2学习
    8.1.3规划
    8.2Dyna-Q结构及其算法改进回
    8.2.1Dyna-Q架构
    8.2.2优先遍历
    8.2.3模拟模型的错误性
    8.3决策时间规划
    8.3.1启发式搜索
    8.3.2预演算法
    8.3.3蒙特卡洛树搜索
    8.4小结
    8.5习题
    第三部分:深度强化学习
    第9章深度学习
    9.1传统神经网络圆
    9.1.1感知器神经元
    9.1.2激活函数
    9.2反向传播算法
    9.2.1前向传播
    9.2.2权重调整
    9.2.3BP算法推导
    9.3卷积神经网络
    9.3.1卷积神经网络核心思想
    9.3.2卷积神经网络结构
    9.4小结
    9.5习题
    第10章PyTorch与神经网络
    10.1PyTorch扣的Tensor
    10.1.1直接构造法
    10.1.2间接转换法
    10.1.3Tensor的变换
    10.2自动梯度计算
    10.2.1标量对标量的自动梯度计算
    10.2.2向量对向量的自动梯度计算
    10.2.3标量对向量(或矩阵)的自动梯度计算
    10.3神经网络的模型搭建和参数优化
    10.3.1模型的搭建
    10.3.2激活函数
    10.3.3常用的损失函数
    10.3.4模型的保存和重载
    10.4小结
    10.5习题
    第ll章深度Q网络
    11.1DQN算法
    11.1.1核心思想
    11.1.2训练算法
    11.1.3实验结果与分析
    11.2DoubleDQN算法
    11.2.1核心思想
    11.2.2实验结果与分析
    11.3PrioritizedDQN
    11.3.1核心思想
    11.3.2训练算法
    11.3.3实验结果与分析
    11.4DuelingDQN
    11.4.1训练算法
    11.4.2实验结果与分析
    11.5小结
    11.6习题
    第12章策略梯度法
    12.1随机策略梯度法
    12.1.1梯度上升算法
    12.1.2策略梯度法与值函数逼近法的比较
    12.2策略优化方法
    12.2.1情节式策略目标函数
    12.2.2连续式策略目标函数
    12.2.3策略梯度定理
    12.3策略表达形式
    12.3.1离散动作空间策略参数化
    12.3.2连续动作空间策略参数化
    ……

    内容简介

    本书基于PyTorch框架,用通俗易懂的语言深入浅出地介绍了强化学习的基本原理,包括传统的强化学习基本方法和目前流行的深度强化学习方法。在对强化学习任务建模的基础上,首先介绍动态规划法、蒙特卡洛法、时序差分法等表格式强化学习方法,然后介绍在PyTorch框架下,DQN、DDPG、A3C等基于深度神经网络的大规模强化学习方法。全书以一个扫地机器人任务贯穿始终,并给出具有代表性的实例,增加对每个算法的理解。全书配有PPT和视频讲解,对相关算法和实例配有代码程序。全书共分三部分:第一和第二部分(第1~8章)为表格式强化学习部分,着重介绍深度强化学习概述、环境的配置、数学建模、动态规划法、蒙特卡洛法、时序差分法、n-步时序差分法、规划和蒙特卡洛树搜索;第三部分(第9~14章)为深度强化学习部分,着重介绍深度学习、PyTorch与神经网络、深度Q网络、策略梯度、基于确定性策略梯度的深度强化学习、AC......

    刘全,黄志刚 编

    "刘全,苏州大学教授,博士生导师。 吉林大学博士, 南京大学软件新技术国家重点实验室博士后。苏州市人工智能学会常务理事、秘书长。2006年开始从事强化学习领域的教学和科研工作。主讲研究生、本科生《强化学习》及相关课程16次。主持“深度强化学习方法研究”、“部分感知强化学习理论及方法”、“基于tableau的逻辑强化学习研究”等国家、省部级项目10余项。目前主要研究方向为:深度强化学习。 2012年获江苏省教工委优秀共产党员称号。2011年、2012年入选江苏省“六大人才”、江苏省“333”人才培养计划。"

    1
    • 商品详情
    • 内容简介

    售后保障

    最近浏览

    猜你喜欢

    该商品在当前城市正在进行 促销

    注:参加抢购将不再享受其他优惠活动

    x
    您已成功将商品加入收藏夹

    查看我的收藏夹

    确定

    非常抱歉,您前期未参加预订活动,
    无法支付尾款哦!

    关闭

    抱歉,您暂无任性付资格

    此时为正式期SUPER会员专享抢购期,普通会员暂不可抢购