实名认证领苏宁支付券立即领取 >
¥
提前抢
SUPER会员专享
由于此商品库存有限,请在下单后15分钟之内支付完成,手慢无哦!
欢迎光临本店铺
点我可查看更多商品哦~
100%刮中券,最高50元无敌券,券有效期7天
亲,今日还有0次刮奖机会
我的云钻:0
您的云钻暂时不足,攒足云钻再来刮
恭喜获得1张券!
今天的机会已经全部用完了,请明天再来
恭喜刮出两张券,请选择一张领取
活动自2017年6月2日上线,敬请关注云钻刮券活动规则更新。
如活动受政府机关指令需要停止举办的,或活动遭受严重网络攻击需暂停举办的,或者系统故障导致的其它意外问题,苏宁无需为此承担赔偿或者进行补偿。
音像学与似动态规划徐昕
¥ ×1
商品
服务
物流
《智能科学技术著作丛书》序前言章绪论1.1引言1.2学与似动态规划的研究概况1.2.1学习研究的相关学科背景1.2.2学习算法的研究进展1..学习的泛化方法与近似动态规划1.2.4学习相关理论研究与多Agent学习1.2.5学习应用的研究进展1.3移动机器人导航控制方法的研究现状和发展趋势1.3.1移动机器人体系结构的研究进展1.3.2移动机器人反应式导航方法的研究概况1.3.3移动机器人路径跟踪控制的研究概况1.4全书的组织结构参考文献第2章线时域差值学习理论与算法2.1Markov链与多步学习预测问题2.1.1Markov链的基础理论2.1.2基于Markov链的多步学习预测问题2.2TD(λ)学习算法2.2.1表格型TD(λ)学习算法2.2.2基于值函数逼近的TD(λ)学习算法.多步递推二乘TD学习算法及其收敛理论..1多步递推二乘TD(RLS-TD(λ)》学习算法..2RLS-TD(λ)学习算法的一致收敛分析2.4多步学习预测的研究2.4.1HopWorld问题学习预测2.4.2连续状态随机行走问题的学习预测2.5小结参考文献第3章基于核的时域差值学习算法3.1核方法与基于核的学习机器3.1.1核函数的概念与质3.1.2核Hilbert空间与核函数方法3.2核二乘时域差值学习算法3.2.1线TD(λ)学习算法3.2.2KLS-TD(λ)学习算法3..学习预测实验与比较3.3小结参考文献第4章求解Markov决策问题的梯度学习算法4.1Markov决策过程与表格型学习算法4.1.1Markov决策过程及其值函数4.1.2表格型学习算法及其收敛理论4.2基于改进CMAC的直接梯度学习算法4.2.1CMAC的结构4.2.2基于CMAC的直接梯度学习算法4..两种改进的CMAC编码结构及其应用实例4.3基于值函数逼近的残差梯度学习算法4.3.1多层前馈神经网络函数逼近器与已有的梯度学习算法4.3.2非平稳策略残差梯度(RGNP)学习算法4.3.3RGNP学习算法的收敛和近似策略能的理论分析4.3.4Mountain-Car问题的研究4.3.5Acrobot学习控制的研究4.4求解连续行为空间Markov决策问题的快速AHC学习算法4.4.1AHC学习算法与Actor-Critic学习控制结构4.4.2Fast-AHC学习算法4.4.3连续控制量条件下的倒立摆学习控制研究4.4.4连续控制量条件下Acrobot系统的学习控制4.5小结参考文献第5章求解Markov决策问题的进化-梯度混合学习算法5.1进化计算的基本原理和方法5.1.1进化计算的基本原理和算法框架5.1.2进化算法的基本要素……第6章基于核的近似动态规划算与理第7章基于学习的移动机器人反应式导航方法第8章RL与ADP在移动机器人运动控制中的应用第9章总结与展望
抢购价:¥ 38.00
易购价:¥ 38.00
注:参加抢购将不再享受其他优惠活动
亲,很抱歉,您购买的宝贝销售异常火爆,让小苏措手不及,请稍后再试~
验证码错误
看不清楚?换一张
确定关闭
亲,大宗购物请点击企业用户渠道>小苏的服务会更贴心!
亲,很抱歉,您购买的宝贝销售异常火爆让小苏措手不及,请稍后再试~
查看我的收藏夹
非常抱歉,您前期未参加预订活动,无法支付尾款哦!
关闭
抱歉,您暂无任性付资格
继续等待
0小时0分
立即开通
SUPER会员