文轩网图书旗舰店
  • 扫码下单

  • 深度强化学习 (印)莫希特·塞瓦克 著 尹大伟,吴敏杰 译 专业科技 文轩网
  • 新华书店正版
    • 作者: (印)莫希特·塞瓦克著 | | 尹大伟,吴敏杰译
    • 出版社: 国防工业出版社
    • 出版时间:2024-06-01 00:00:00
    送至
  • 由""直接销售和发货,并提供售后服务
  • 加入购物车 购买电子书
    服务

    看了又看

    商品预定流程:

    查看大图
    /
    ×

    店铺装修中

    商家:
    文轩网图书旗舰店
    联系:
    • 商品

    • 服务

    • 物流

    搜索店内商品

    文轩网图书旗舰店

  •      https://product.suning.com/0070067633/11555288247.html

     

    商品参数
    • 作者: (印)莫希特·塞瓦克著| 尹大伟,吴敏杰译
    • 出版社:国防工业出版社
    • 出版时间:2024-06-01 00:00:00
    • 版次:1
    • 印次:1
    • 印刷时间:2024-06-01
    • 字数:190000
    • 页数:176
    • 开本:16开
    • 装帧:平装
    • ISBN:9787118131796
    • 国别/地区:中国
    • 版权提供:国防工业出版社

    深度强化学习

    作  者:(印)莫希特·塞瓦克 著 尹大伟,吴敏杰 译
    定  价:89
    出 版 社:国防工业出版社
    出版日期:2024年06月01日
    页  数:176
    装  帧:平装
    ISBN:9787118131796
    主编推荐

    内容简介

    本书主要内容包括:介绍了强化学习的基本概念,如智能体、环境、状态、奖励、动作等;介绍了强化学习的数学和算法原理,如马尔可夫决策过程和贝尔曼方程,并在此基础上讨论了动态规划、值迭代和策略迭代方法;介绍了强化学习的估计与控制问题,并通过实例展示了Q学习的编程;深入探讨了深度学习的概念、架构机制,通过介绍激活函数、损失函数、优化器、卷积层、池化层、全连接层等概念,为后续章节与强化学习算法相结合作铺垫。

    作者简介

    精彩内容

    目录
    第1章强化学习简介:AI智能体背后的智能
    1.1什么是人工智能,强化学习与它有什么关系?
    1.2理解强化学习的基本设计
    1.3强化学习中的奖励和确定一个合适的奖励函数所涉及的问题
    1.4强化学习的状态
    1.5强化学习中的智能体
    1.6小结
    第2章强化学习的数学和算法理解:马尔可夫决策过程与解决方法
    2.1马尔可夫决策过程
    2.2贝尔曼方程
    2.3动态规划和贝尔曼方程
    2.4价值迭代和策略迭代方法
    2.5小结
    第3章编码环境和马尔可夫决策过程的求解:编码环境、价值迭代和策略迭代算法
    3.1以网格世界问题为例
    3.2构建环境
    3.3平台要求和代码的工程架构
    ……

    售后保障

    最近浏览

    猜你喜欢

    该商品在当前城市正在进行 促销

    注:参加抢购将不再享受其他优惠活动

    x
    您已成功将商品加入收藏夹

    查看我的收藏夹

    确定

    非常抱歉,您前期未参加预订活动,
    无法支付尾款哦!

    关闭

    抱歉,您暂无任性付资格

    此时为正式期SUPER会员专享抢购期,普通会员暂不可抢购