由于此商品库存有限,请在下单后15分钟之内支付完成,手慢无哦!
100%刮中券,最高50元无敌券,券有效期7天
活动自2017年6月2日上线,敬请关注云钻刮券活动规则更新。
如活动受政府机关指令需要停止举办的,或活动遭受严重网络攻击需暂停举办的,或者系统故障导致的其它意外问题,苏宁无需为此承担赔偿或者进行补偿。
醉染图书强化学习 微课版9787302587941
¥ ×1
I 概述
章 导论
1.1 强化学习简介
1.1.1 两个主要特征
1.1.2 与机器学习的关系
1.2 强化学习发展史
1.2.1 试错学习
1.2.2 很优控制
1.. 时序差分学习
1.2.4 深度强化学习
1.3 本书的主要内容
1.4 本章小结
II 预备知识
第2章 概率统计与随机过程
2.1 概率论
2.1.1 集合
2.1.2 概率
2.1.3 随机试与随事件
2.1.4 条件概率与独立事件
2.1.5 随机变量
2.1.6 期望与方差
2.1.7 概率分布
2.2 统计学基础
2.2.1 大数定律
2.2.2 中心极限定理
. 随机过程
..1 基本概念
..2 分布函数
.. 基本类型
..4 马尔可夫过程
..5 马尔可夫链的状态分类
.. 平稳分布
2.4 本章小结
第3章 机器学习
3.1 基本概念
3.2 线回归
3.3 逻辑回归
3.3.1 逻辑回归模型
3.3.2 逻辑回归指标
3.3.3 逻辑回归算法
3.4 随机梯度下降
3.4.1 随机梯度下降法
3.4.2 基于SGD实现逻辑回归
3.5 本章小结
第4章 神经网络
4.1 神经元
4.2 感知机
4.2.1 感知机模型
4.2.2 感知机指标
4.. 感知机算法
4.3 神经网络
4.3.1 神经网络模型
4.3.2 神经网络指标
4.3.3 神经网络算法
4.3.4 梯度消失现象
4.4 本章小结
第5章 深度学习
……
III 强化学习基础
IV 表格求解法
V 近似求解法
VI 实践与前沿
VII 附录
袁莎,清华大学计算机系博士后,合作导师为唐杰教授,主持一项自然科学青年项目和一项博士后科学面上项目。唐杰 IEEE Fellow,清华大学计算机系教授、系副主任,获杰出青年科学、王选杰青奖。研究人工智能、认知图谱、数据挖掘、社交网络和机器学习。发表300余篇,获ACM SGKD Test-of-Time Award(十年很好)。主持研发了超大规模预训练模型“悟道”,参数规模超过1.75万亿。之前还研发了研究者社会网络挖掘系统AMiner,吸引全球220个/地区2000多万用户。担任国际期刊IEEE T. on Big Data、AI OPEN主编以及WWW’大会。获科技进步二等奖、北京市科技进步一等奖、北京市专利奖一等奖、人工智能学会科技进步一等奖、KDD杰出贡献奖。
本书是强化学习领域的入门书籍。本书结合大量清晰易懂的实际用用案例,能够帮读者更好地理解强化学习各个算法的实现原理,降低了强化学习入学门槛。书中架构安排合理,语言表达准确,推理明齐全。
亲,大宗购物请点击企业用户渠道>小苏的服务会更贴心!
亲,很抱歉,您购买的宝贝销售异常火爆让小苏措手不及,请稍后再试~
非常抱歉,您前期未参加预订活动,
无法支付尾款哦!
抱歉,您暂无任性付资格