返回首页
苏宁会员
购物车 0
易付宝
手机苏宁

服务体验

店铺评分与同行业相比

用户评价:----

物流时效:----

售后服务:----

  • 服务承诺: 正品保障
  • 公司名称:
  • 所 在 地:

  • 深度强化学习 基于Python的理论及实践(英文版) (美)劳拉·格雷泽,(美)龚辉伦 著 大中专 文轩网
  • 新华书店正版
    • 作者: (美)劳拉·格雷泽//龚辉伦著
    • 出版社: 机械工业出版社
    • 出版时间:2021-01-01 00:00:00
    送至
  • 由""直接销售和发货,并提供售后服务
  • 加入购物车 购买电子书
    服务

    看了又看

    商品预定流程:

    查看大图
    /
    ×

    苏宁商家

    商家:
    文轩网图书旗舰店
    联系:
    • 商品

    • 服务

    • 物流

    搜索店内商品

    商品分类

         https://product.suning.com/0070067633/11555288247.html

     

    商品参数
    • 作者: (美)劳拉·格雷泽//龚辉伦著
    • 出版社:机械工业出版社
    • 出版时间:2021-01-01 00:00:00
    • 版次:1
    • 印次:1
    • 印刷时间:2021-01-01
    • 字数:285
    • 页数:362
    • 开本:16开
    • 装帧:平装
    • ISBN:9787111670407
    • 国别/地区:中国
    • 版权提供:机械工业出版社

    深度强化学习 基于Python的理论及实践(英文版)

    作  者:(美)劳拉·格雷泽,(美)龚辉伦 著
    定  价:119
    出 版 社:机械工业出版社
    出版日期:2021年01月01日
    页  数:396
    装  帧:平装
    ISBN:9787111670407
    主编推荐

    内容简介

    深度强化学习结合了深度学习和强化学习,使人工智能体能够在没有监督的情况下学习如何解决顺序决策问题。在过去的十年中,深度强化学习在一系列问题上取得了显著的成果,涵盖从单机游戏和多人游戏到机器人技术等方方面面。本书采用理论结合实践的方法,从直觉开始,然后仔细解释深度强化学习算法的理论,讨论在配套软件库SLMLab中的实现,最后呈现深度强化学习算法的实践细节。

    作者简介

      

    精彩内容

    目录
    第1章强化学习简介
    1.1强化学习
    1.2强化学习中的MDP
    1.3强化学习中的学习函数
    l.4深度强化学习算法
    1.4.1基于策略的算法
    1.4.2基于值的算法
    1.4.3基于模型的算法
    1.4.4组合方法
    1.4.5本书中的算法
    1.4.6同策略和异策略算法
    1.4.7小结
    1.5强化学习中的深度学习
    1.6强化学习与监督学习
    1.6.1缺乏先知
    1.6.2反馈稀疏性
    1.6.3数据生成
    1.7总结
    第一部分基于策略的算法和基于值的算法
    第2章REINFORCE
    2.1策略
    2.2目标函数
    2.3策略梯度
    2.3.1策略梯度推导
    2.4蒙特卡罗采样
    2.5REINFORCE算法
    2.5.1改进的REINFORCE算法
    2.6实现REINFORECE
    2.6.1一种最小化RINFORCE的实现
    2.6.2用PvTorch构建策略
    2.6.3采样动作
    2.6.4计算策略损失
    2.6.5REINFORCE训练循环
    2.6.6同策略内存回放
    2.7训练REINFORCE智能体
    2.8实验结果
    2.8.1实验:评估折扣因子y的影响
    2.8.2实验:评估基准线的影响
    2.9总结
    2.10扩展阅读
    2.11历史回顾
    第3章SARSA
    3.1Q函数和V函数
    3.2时序差分学习
    3.2.1时序差分学习示例
    3.3sARsA中的动作选择
    3.3.1探索和利用
    3.4SARSA算法
    3.4.1同策略算法
    3.5实现SARSA
    3.5.1动作函数:□贪婪
    3.5.2计算Q损失
    3.5.3SARSA训练循环
    3.5.4同策略批处理内存回放
    3.6训练sARsA智能体
    3.7实验结果
    3.7.1实验:评估学习率的影响
    3.8总结
    3.9扩展阅读
    3.10历史回顾
    ……
    第二部分组合方法
    第三部分实践细节
    第四部分环境设计
    后记
    附录
    参考文献

    售后保障

    最近浏览

    猜你喜欢

    该商品在当前城市正在进行 促销

    注:参加抢购将不再享受其他优惠活动

    x
    您已成功将商品加入收藏夹

    查看我的收藏夹

    确定

    非常抱歉,您前期未参加预订活动,
    无法支付尾款哦!

    关闭

    抱歉,您暂无任性付资格

    此时为正式期SUPER会员专享抢购期,普通会员暂不可抢购