返回首页
苏宁会员
购物车 0
易付宝
手机苏宁

服务体验

店铺评分与同行业相比

用户评价:----

物流时效:----

售后服务:----

  • 服务承诺: 正品保障
  • 公司名称:
  • 所 在 地:

  • 强化学习实战——从零开始制作AlphaGo围棋 微课视频版 刘佳 著 专业科技 文轩网
  • 新华书店正版
    • 作者: 刘佳著
    • 出版社: 清华大学出版社
    • 出版时间:2023-04-01 00:00:00
    送至
  • 由""直接销售和发货,并提供售后服务
  • 加入购物车 购买电子书
    服务

    看了又看

    商品预定流程:

    查看大图
    /
    ×

    苏宁商家

    商家:
    文轩网图书旗舰店
    联系:
    • 商品

    • 服务

    • 物流

    搜索店内商品

    商品分类

         https://product.suning.com/0070067633/11555288247.html

     

    商品参数
    • 作者: 刘佳著
    • 出版社:清华大学出版社
    • 出版时间:2023-04-01 00:00:00
    • 版次:1
    • 印次:1
    • 印刷时间:2023-04-01
    • 页数:0
    • 开本:其他
    • 装帧:平装
    • ISBN:9787302629696
    • 国别/地区:中国
    • 版权提供:清华大学出版社

    强化学习实战——从零开始制作AlphaGo围棋 微课视频版

    作  者:刘佳 著
    定  价:69.9
    出 版 社:清华大学出版社
    出版日期:2023年04月01日
    页  数:200
    装  帧:平装
    ISBN:9787302629696
    主编推荐

    (1)问题驱动,由浅入深。 本书通过分解问题,由浅入深、逐步地对如何实践超越人类大师级水平的计算机棋类智能体的重要概念及原理进行讲解与探究,为读者更好地掌握其背后的计算机强化学习原理提供便利和支持。 (2)突出重点,强化理解。 本书结合作者多年的教学与实践经验,针对应用型本科的教学要求和学生特点,突出重点、深入分析,同时在内容方面全面兼顾知识的系统化要求。 (3)注重理论,联系实际。 本书为重要的知识点均配备了代码讲解,采用Python语言结合Keras和PyTorch工具库通过对围棋智能体的代码实践,加深对机器学习,特别是强化学习的再认识。 (4)风格简洁,使用方便。 本书风格简洁明快,对于非重点的内容不做长篇论述,以便读者在学习过程中明确内容之间的逻辑关系,更好地掌握深度强化学习的内容。

    内容简介

    本书通过基础理论和算法实践相结合,循序渐进地介绍了人工智能领域中的常见算法,并以围棋游戏作为媒介,全面、系统地介绍了人工智能算法的实现方法,并通过Keras和PyTorch框架实践人工智能算法中的深度强化学习内容。全书共10章,分别介绍围棋的基础知识、如何制作围棋软件、传统棋类智能算法、神经网络入门知识、如何实现围棋智能体程序、通用化围棋智能体程序、策略梯度算法、基于价值的深度学习网络(DQN)算法、Actor-Critic算法、如何实践AlphaGo和AlphaZero等知识,书中的每个知识点都有相应的实现代码和实例。本书主要面向广大从事数据分析、机器学习、数据挖掘或深度学习的专业人员,从事高等教育的专任教师,高等学校的在读学生及相关领域的广大科研人员。

    作者简介

    精彩内容

    目录
    第一部分 计算机围棋的基础知识和传统的智能算法
    第1章 围棋:黑白的世界
    1.1什么是围棋
    1.2围棋的规则
    1.3胜负的判定
    1.4围棋棋手的棋力
    1.5计算机眼中的围棋
    1.5.1SGF文件
    1.5.2GTP
    第2章 实现一个围棋软件
    2.1软件版本
    2.2围棋软件的组成
    2.3佐布里斯特散列
    2.4围棋智能体
    2.5围棋的棋盘
    2.6引入裁判
    2.7让智能体下棋
    第3章 传统的棋类智能
    3.1极小化极大算法
    3.2Alpha-Beta剪枝算法
    3.3棋类局面评估
    3.4蒙特卡罗模拟
    3.4.1蒙特卡罗算法
    3.4.2蒙特卡罗树搜索
    3.4.3蒙特卡罗算法改进
    3.4.4需要注意的问题
    3.5监督学习
    3.6传统方法的讨论
    第二部分 基于神经网络的机器学习
    第4章 机器学习入门
    4.1人工神经网络
    4.1.1神经元
    4.1.2常见的激活函数
    4.1.3多层感知器
    4.1.4卷积神经网络
    4.1.5反向传播算法
    4.1.6小批量训练法
    4.1.7残差网络
    4.1.8多层感知器的应用示例
    4.1.9卷积网络对图片进行多分类的应用示例
    4.2优化神经网络
    4.2.1训练集、验证集、测试集以及交叉验证
    4.2.2欠拟合与过拟合
    4.2.3损失函数的正则化
    4.2.4准确率和召回率的权衡
    4.3其他人工智能方法简介
    4.3.1K近邻算法
    4.3.2朴素贝叶斯法
    4.3.3决策树
    4.3.4Boosting算法/Bagging算法
    4.3.5支持向量机
    4.3.6随机场算法
    4.3.7传统智能算法所面临的挑战
    第5章 第一个围棋智能体
    5.1电子围棋棋谱
    5.2HDF5文件结构
    5.3数据模型
    5.4获取训练样本
    5.5代码演示
    第6章 通用化围棋智能体程序
    6.1在网络上发布围棋智能体
    6.2本地对战
    6.2.1计算机的围棋语言
    6.2.2围棋的对弈图形界面
    6.2.3围棋引擎
    6.3让围棋智能体自己去网上下棋
    第三部分 强化学习
    第7章 策略梯度
    第8章 深度价值网络
    8.1传统的Q-Learning算法
    8.1.1原始版Q-Learning
    8.1.2原始版Q-Learning计算时的优化
    8.1.3Q-Learning的变种Sarsa
    8.1.4Sarsa的进化Sarsa-λ
    8.2在神经网络上应用DQN
    第9章 Actor-Critic算法
    第10章 AlphaGo和AlphaZero
    10.1AlphaGo的结构和训练流程
    10.2AlphaZero的结构与训练流程
    10.3可行的优化
    附录A Keras入门
    附录B PyTorch入门
    附录C 反向传播算法
    C.1命名约定
    C.2正文
    C.3进一步讨论
    C.4拓展
    附录D 不同地区的围棋规则
    D.1中国规则
    D.2日本规则
    D.3应氏规则
    D.4新西兰规则
    D.5美国规则
    D.6智运会规则
    D.7Tromp-Taylor规则

    售后保障

    最近浏览

    猜你喜欢

    该商品在当前城市正在进行 促销

    注:参加抢购将不再享受其他优惠活动

    x
    您已成功将商品加入收藏夹

    查看我的收藏夹

    确定

    非常抱歉,您前期未参加预订活动,
    无法支付尾款哦!

    关闭

    抱歉,您暂无任性付资格

    此时为正式期SUPER会员专享抢购期,普通会员暂不可抢购