诺森图书音像专营店
  • 扫码下单

  • 音像学与似动态规划徐昕
  • 正版
    • 作者: 徐昕著 | 徐昕编 | 徐昕译 | 徐昕绘
    • 出版社: 科学出版社
    • 出版时间:2010-05-01
    送至
  • 由""直接销售和发货,并提供售后服务
  • 加入购物车 购买电子书
    服务

    看了又看

    商品预定流程:

    查看大图
    /
    ×

    店铺装修中

    商家:
    诺森图书音像专营店
    联系:
    • 商品

    • 服务

    • 物流

    搜索店内商品

    诺森图书音像专营店

  • 商品参数
    • 作者: 徐昕著| 徐昕编| 徐昕译| 徐昕绘
    • 出版社:科学出版社
    • 出版时间:2010-05-01
    • 版次:1
    • 印次:3
    • 字数:267000
    • 页数:224
    • 开本:B5
    • ISBN:9787030275653
    • 版权提供:科学出版社
    • 作者:徐昕
    • 著:徐昕
    • 装帧:平装
    • 印次:3
    • 定价:88.00
    • ISBN:9787030275653
    • 出版社:科学出版社
    • 开本:B5
    • 印刷时间:暂无
    • 语种:暂无
    • 出版时间:2010-05-01
    • 页数:224
    • 外部编号:1202316027
    • 版次:1
    • 成品尺寸:暂无

    《智能科学技术著作丛书》序

    前言

    章绪论

    1.1引言

    1.2学与似动态规划的研究概况

    1.2.1学习研究的相关学科背景

    1.2.2学习算法的研究进展

    1..学习的泛化方法与近似动态规划

    1.2.4学习相关理论研究与多Agent学习

    1.2.5学习应用的研究进展

    1.3移动机器人导航控制方法的研究现状和发展趋势

    1.3.1移动机器人体系结构的研究进展

    1.3.2移动机器人反应式导航方法的研究概况

    1.3.3移动机器人路径跟踪控制的研究概况

    1.4全书的组织结构

    参考文献

    第2章线时域差值学习理论与算法

    2.1Markov链与多步学习预测问题

    2.1.1Markov链的基础理论

    2.1.2基于Markov链的多步学习预测问题

    2.2TD(λ)学习算法

    2.2.1表格型TD(λ)学习算法

    2.2.2基于值函数逼近的TD(λ)学习算法

    .多步递推二乘TD学习算法及其收敛理论

    ..1多步递推二乘TD(RLS-TD(λ)》学习算法

    ..2RLS-TD(λ)学习算法的一致收敛分析

    2.4多步学习预测的研究

    2.4.1HopWorld问题学习预测

    2.4.2连续状态随机行走问题的学习预测

    2.5小结

    参考文献

    第3章基于核的时域差值学习算法

    3.1核方法与基于核的学习机器

    3.1.1核函数的概念与质

    3.1.2核Hilbert空间与核函数方法

    3.2核二乘时域差值学习算法

    3.2.1线TD(λ)学习算法

    3.2.2KLS-TD(λ)学习算法

    3..学习预测实验与比较

    3.3小结

    参考文献

    第4章求解Markov决策问题的梯度学习算法

    4.1Markov决策过程与表格型学习算法

    4.1.1Markov决策过程及其值函数

    4.1.2表格型学习算法及其收敛理论

    4.2基于改进CMAC的直接梯度学习算法

    4.2.1CMAC的结构

    4.2.2基于CMAC的直接梯度学习算法

    4..两种改进的CMAC编码结构及其应用实例

    4.3基于值函数逼近的残差梯度学习算法

    4.3.1多层前馈神经网络函数逼近器与已有的梯度学习算法

    4.3.2非平稳策略残差梯度(RGNP)学习算法

    4.3.3RGNP学习算法的收敛和近似策略能的理论分析

    4.3.4Mountain-Car问题的研究

    4.3.5Acrobot学习控制的研究

    4.4求解连续行为空间Markov决策问题的快速AHC学习算法

    4.4.1AHC学习算法与Actor-Critic学习控制结构

    4.4.2Fast-AHC学习算法

    4.4.3连续控制量条件下的倒立摆学习控制研究

    4.4.4连续控制量条件下Acrobot系统的学习控制

    4.5小结

    参考文献

    第5章求解Markov决策问题的进化-梯度混合学习算法

    5.1进化计算的基本原理和方法

    5.1.1进化计算的基本原理和算法框架

    5.1.2进化算法的基本要素

    ……

    第6章基于核的近似动态规划算与理

    第7章基于学习的移动机器人反应式导航方法

    第8章RL与ADP在移动机器人运动控制中的应用

    第9章总结与展望

    售后保障

    最近浏览

    猜你喜欢

    该商品在当前城市正在进行 促销

    注:参加抢购将不再享受其他优惠活动

    x
    您已成功将商品加入收藏夹

    查看我的收藏夹

    确定

    非常抱歉,您前期未参加预订活动,
    无法支付尾款哦!

    关闭

    抱歉,您暂无任性付资格

    此时为正式期SUPER会员专享抢购期,普通会员暂不可抢购