由于此商品库存有限,请在下单后15分钟之内支付完成,手慢无哦!
100%刮中券,最高50元无敌券,券有效期7天
活动自2017年6月2日上线,敬请关注云钻刮券活动规则更新。
如活动受政府机关指令需要停止举办的,或活动遭受严重网络攻击需暂停举办的,或者系统故障导致的其它意外问题,苏宁无需为此承担赔偿或者进行补偿。
正版 Python机器学习:基于PyTorch和Scikit-Learn
¥ ×1
译者序
序
前言
作者简介
审校者简介
第1章赋予计算机从数据中学习的能力1
1.1将数据转化为知识的智能系统1
1.2三种机器学习类型2
1.2.1用于预测未来的监督学习2
1.2.2解决交互问题的强化学习4
1.2.3发现数据中隐藏规律的无监督学习 5
1.3基本术语与符号6
1.3.1本书中使用的符号和约定6
1.3.2机器学习术语8
1.4构建机器学习系统的路线图8
1.4.1数据预处理——让数据可用8
1.4.2训练和选择预测模型9
1.4.3使用未见过的数据对模型进行评估10
1.5使用Python实现机器学习算法10
1.5.1从Python Package Index中安装Python和其他软件包10
1.5.2使用Anaconda Python软件包管理器11
1.5.3科学计算、数据科学和机器学习软件包12
1.6本章小结13
第2章训练简单的机器学习分类算法14
2.1人工神经元——机器学习早期历史一瞥14
2.1.1人工神经元的定义15
2.1.2感知机学习规则16
2.2使用Python实现感知机学习算法19
2.2.1面向对象的感知机API19
2.2.2使用鸢尾花数据集训练感知机22
2.3自适应线性神经元与算法收敛27
2.3.1使用梯度下降法最小化损失函数28
2.3.2在Python中实现Adaline30
2.3.3通过特征缩放改进梯度下降34
2.3.4大规模机器学习与随机梯度下降36
2.4本章小结41
第3章Scikit-Learn机器学习分类算法之旅42
3.1分类算法的选择42
3.2学习Scikit-Learn的第一步——训练感知机43
3.3用逻辑回归算法建模分类概率48
3.3.1逻辑回归与条件概率48
3.3.2用逻辑损失函数更新模型权重51
3.3.3从Adaline的代码实现到逻辑回归的代码实现53
3.3.4用Scikit-Learn训练逻辑回归模型56
3.3.5使用正则化避免模型过拟合59
3.4基于优选分类间隔的支持向量机62
3.4.1理解优选分类间隔62
3.4.2使用松弛变量解决非线性可分问题62
3.4.3Scikit-Learn中另外一种实现64
3.5使用核支持向量机求解非线性问题64
3.5.1处理线性不可分数据的核方法64
3.5.2使用核方法在高维空间中寻找分离超平面66
3.6决策树学习69
3.6.1优选化信息增益70
3.6.2构建决策树73
3.6.3多棵决策树组成随机森林76
3.7基于惰性学习策略的k近邻算法78
3.8本章小结81
第4章构建良好的训练数据集——数据预处理83
4.1处理缺失值83
4.1.1识别表格数据中的缺失值83
4.1.2删除含有缺失值的样本或特征85
4.1.3填补缺失值85
4.1.4Scikit-Learn的估计器86
4.2处理类别数据87
4.2.1用pandas实现类别数据编码88
4.2.2映射有序特征88
4.2.3类别标签编码89
4.2.4标称特征的独热编码90
4.3将数据集划分为训练数据集和测试数据集93
4.4使特征具有相同的尺度95
4.5选择有意义的特征97
4.5.1用L1和L2正则化对模型复杂度进行惩罚98
4.5.2L2正则化的几何解释98
4.5.3L1正则化与稀疏解99
4.5.4序贯特征选择算法102
4.6用随机森林评估特征重要性107
4.7本章小结109
第5章通过降维方法压缩数据110
5.1无监督降维的主成分分析方法110
5.1.1主成分分析的主要步骤110
5.1.2提取主成分的步骤112
5.1.3总方差和被解释的方差114
5.1.4特征变换115
5.1.5用Scikit-Learn实现主成分分析118
5.1.6评估特征的贡献120
5.2监督数据压缩的线性判别分析方法122
5.2.1主成分分析与线性判别分析122
5.2.2线性判别分析基本原理123
5.2.3计算散布矩阵124
5.2.4为新特征子空间选择线性判别式126
5.2.5将样本投影到新的特征空间128
5.2.6用Scikit-Learn实现线性判别分析128
5.3非线性降维和可视化130
5.3.1非线性降维的不足130
5.3.2使用t-SNE可视化数据131
5.4本章小结135
第6章模型评估和超参数调优的很好实践136
6.1使用pipeline方法简化工作流程136
6.1.1加载威斯康星乳腺癌数据集136
6.1.2在pipeline中集成转换器和估计器138
6.2使用k折交叉验证评估模型性能140
6.2.1holdout交叉验证140
6.2.2k折交叉验证140
6.3用学习曲线和验证曲线调试算法144
6.3.1使用学习曲线解决偏差和方差问题144
6.3.2使用验证曲线解决过拟合和欠拟合问题146
6.4通过网格搜索微调机器学习模型148
……
本书深入介绍了机器学习领域的基本概念和方法,除介绍了Python机器学习库和用机器学习库搭建神经网络模型的方法外,还介绍了机器学习算法的数学理论、工作原理、使用方法、实现细节以及如何避免机器学习算法实现过程中的常见问题。本书涵盖了多种用于文本和图像分类的机器学习与深度学习方法,以及用于生成新数据的生成对抗网络(GAN)和用于训练智能体的强化学习,还介绍了深度学习的新动态,包括图神经网络和用于自然语言处理(NLP)的大型transformer。本书讲解清晰,示例生动,理论和实践部分相对平衡,既可以作为机器学习领域初学者的入门教程,也可以作为读者开发机器学习项目时的参考书。
本书是一本在PyTorch环境下学习机器学习和深度学习的综合指南,可以作为初学者的入门教程,也可以作为读者开发机器学习项目时的参考书。 本书讲解清晰、示例生动,深入介绍了机器学习方法的基础知识,不仅提供了构建机器学习模型的说明,而且提供了构建机器学习模型和解决实际问题的基本准则。 本书添加了基于PyTorch的深度学习内容,介绍了新版Scikit-Learn。本书涵盖了多种用于文本和图像分类的机器学习与深度学习方法,介绍了用于生成新数据的生成对抗网络(GAN)和用于训练智能体的强化学习。最后,本书还介绍了深度学习的新动态,包括图神经网络和用于自然语言处理(NLP)的大型transformer。 无论是机器学习入门新手,还是计划跟踪机器学习进展的研发人员,都可以将本书作为使用Python进行机器学习的不二之选。
亲,大宗购物请点击企业用户渠道>小苏的服务会更贴心!
亲,很抱歉,您购买的宝贝销售异常火爆让小苏措手不及,请稍后再试~
非常抱歉,您前期未参加预订活动,
无法支付尾款哦!
抱歉,您暂无任性付资格