萌萌哒图书专营店
  • 扫码下单

  • 全新强化学习邹伟,鬲玲,刘昱杓9787302538295
  • 正版
    • 作者: 邹伟,鬲玲,刘昱杓著 | 邹伟,鬲玲,刘昱杓编 | 邹伟,鬲玲,刘昱杓译 | 邹伟,鬲玲,刘昱杓绘
    • 出版社: 清华大学出版社
    • 出版时间:2020-06-01
    送至
  • 由""直接销售和发货,并提供售后服务
  • 加入购物车 购买电子书
    服务

    看了又看

    商品预定流程:

    查看大图
    /
    ×

    店铺装修中

    商家:
    萌萌哒图书专营店
    联系:
    • 商品

    • 服务

    • 物流

    搜索店内商品

    萌萌哒图书专营店

  • 商品参数
    • 作者: 邹伟,鬲玲,刘昱杓著| 邹伟,鬲玲,刘昱杓编| 邹伟,鬲玲,刘昱杓译| 邹伟,鬲玲,刘昱杓绘
    • 出版社:清华大学出版社
    • 出版时间:2020-06-01
    • 版次:1
    • 印次:1
    • 字数:577000
    • 页数:380
    • 开本:16开
    • ISBN:9787302538295
    • 版权提供:清华大学出版社
    • 作者:邹伟,鬲玲,刘昱杓
    • 著:邹伟,鬲玲,刘昱杓
    • 装帧:平装
    • 印次:1
    • 定价:99.00
    • ISBN:9787302538295
    • 出版社:清华大学出版社
    • 开本:16开
    • 印刷时间:暂无
    • 语种:暂无
    • 出版时间:2020-06-01
    • 页数:380
    • 外部编号:1202064787
    • 版次:1
    • 成品尺寸:暂无

    章 强化学习概述

    1.1 强化学习的背景

    1.2 强化学习初探

    1.2.1 智能体和环境

    1.2.2 智能体主要组成

    1.. 强化学习、监督学习、非监督学习

    1.2.4 强化学习分类

    1.2.5 研究方法

    1.2.6 发展历程

    1.3 强化学习的重点概念

    1.3.1 学习与规划

    1.3.2 探索与利用

    1.3.3 预测与控制

    1.4 小结

    1.5 习题

    第2章 马尔可夫决策过程

    2.1 马尔可夫基本概念

    2.1.1 马尔可夫

    2.1.2 马尔可夫过程

    2.1.3 马尔可夫决策过程

    2.2 贝尔曼方程

    2.2.1 贝尔曼期望方程

    2.2.2 贝尔曼方程

    . 策略

    ..1 策略定义

    ..2 求解策略

    2.4 小结

    2.5 习题

    第3章 动态规划

    3.1 动态规划简介

    3.2 策略评估

    3.3 策略改进

    3.4 策略迭代

    3.5 值迭代

    3.6 实例讲解

    3.6.1 “找宝藏”环境描述

    3.6.2 策略迭代

    3.6.3 值迭代

    3.6.4 实例小结

    3.7 小结

    3.8 习题

    第4章

    4.1 简介

    4.2 评估

    4.3 控制

    4.4 在线策略

    4.5 离线策略

    4.5.1 重要采样离线策略

    4.5.2 加权重要采样离线策略

    4.6 实例讲解

    4.6.1 “十点半”游戏

    4.6.2 在线策略

    4.6.3 离线策略

    4.6.4 实例小结

    4.7 小结

    4.8 习题

    第5章 时序差分

    5.1 时序差分简介

    5.2 三种方法的质对比

    5.3 Sarsa:在线策略TD

    5.4 -learning:离线策略TD方法

    ……

    第6章 资格迹

    第7章 值函数逼近

    第8章 随机策略梯度

    第9章 Actor-Critic及变种

    0章 确定策略梯度

    1章 学习与规划

    2章 探索与利用

    3章 博弈强化学习

    参考文献

    "邹伟 博士,睿客邦创始人,研究方向为机器学习、数据挖掘、计算几何,致力于机器学习和深度学习在实际中的应用;主持研发50多个人工智能领域工业级项目,并受邀在中国移动、花旗银行、中信集团、中航信、烽火科技、方、完美世界等公司进行了上百场讲座和内部培训。创立的睿客邦与国内十多所高校建立了AI联合实验室或实训基地;兼任天津大学创业导师、山东交通学院客座教授等。曾在多个在线平台讲授“机器学习”“深度学习”等课程,广受网友累计学习人数超过百万。
    鬲玲 硕士,北京神舟航天软件公司知识工程团队负责人,资深研发。研究方向为知识工程、语义检索、强化学习、自然语言处理。作为牵头单位技术负责人参与并完成科技支撑计划项目1项,863计划项目1项。有多年知识管理系统以及自然语言处理项目研发经验,目前正致力于垂直领域知识图谱的落地以及强化学习在自然语言处理领域的应用。
    刘昱杓 现供职于央视市场研究,深度学习、强化学习研发,研究方向为计算机视觉。有多年深度学习视觉方向开发经验,参与了多个图像识别、目标检测、目标追踪等领域的落地项目。目前专注于深度强化学习方向的研究。
    "

    "为了让读者快速理解和应用强化学习技术,《强化学习》深入分析了相关算法的具体实现,由浅入深,循序渐进,内容丰富,易学实用。
    《强化学习》作者具有丰富的行业实践经验,使得内容兼具理论与实,不仅给出了算法的运行流程,还给出了该类算法的应用案例。书中列举了近20个强化学习算法案例,可以帮读者快速提升自己的能力。
    "

    售后保障

    最近浏览

    猜你喜欢

    该商品在当前城市正在进行 促销

    注:参加抢购将不再享受其他优惠活动

    x
    您已成功将商品加入收藏夹

    查看我的收藏夹

    确定

    非常抱歉,您前期未参加预订活动,
    无法支付尾款哦!

    关闭

    抱歉,您暂无任性付资格

    此时为正式期SUPER会员专享抢购期,普通会员暂不可抢购