由于此商品库存有限,请在下单后15分钟之内支付完成,手慢无哦!
100%刮中券,最高50元无敌券,券有效期7天
活动自2017年6月2日上线,敬请关注云钻刮券活动规则更新。
如活动受政府机关指令需要停止举办的,或活动遭受严重网络攻击需暂停举办的,或者系统故障导致的其它意外问题,苏宁无需为此承担赔偿或者进行补偿。
醉染图书数据科学实战入门 使用Python和R9787302553793
¥ ×1
章数据科学导引1
1.1为何学习数据科学1
1.2何为数据科学1
1.3数据科学方2
1.4数据科学任务5
1.4.1描述5
1.4.2估计6
1.4.3分类6
1.4.4聚类6
1.4.5预测6
1.4.6关联7
1.5习题7
第2章Python和R语言基础9
2.1下载Python9
2.2Python编程基础10
2.2.1在Python中使用注释10
2.2.2在Python中执行命令11
2..在Python中导入软件包11
2.2.4将数据引入Python12
2.2.5在Python中保存输出13
2.2.6访问Python中的记录和变量14
2.2.7在Python中设置图形16
.下载R和RStudi8
2.4R语言编程基础19
2.4.1在R中使用注释20
2.4.2在R中执行命令20
2.4.3在R中导入软件包20
2.4.4将数据导入R21
2.4.5在R中保存输出
2.4.6在R中访问记录和变量24
2.5习题26
第3章数据准备29
3.1银行营销数据集29
3.2问题理解阶段29
3.2.1明确阐明项目目标29
3.2.2将这些目标转化为数据科学问题30
3.3数据准备阶段30
3.4添加索引字段31
3.4.1如何使用Python添加索引字段31
3.4.2如何使用R添加索引字段32
3.5更改误导字段值33
3.5.1如何使用Python更改误导字段值33
3.5.2如何使用R更改误导字段值35
3.6将分类数据重新表示为数字36
3.6.1如何使用Python重新表达分类字段值37
3.6.2如何使用R重新表达分类字段值38
3.7标准化数字字段39
3.7.1如何使用Python标准化数字字段40
3.7.2如何使用R标准化数字字段40
3.8识别异常值40
3.8.1如何使用Python识别异常值41
3.8.2如何使用R识别异常值42
3.9习题43
第4章探索数据分析47
4.1EDA对比HT47
4.2叠加了response的条形图47
4.2.1如何使用Python构建叠加的条形图49
4.2.2如何使用R构建叠加的条形图50
4.3列联表51
4.3.1如何使用Python构建列联表52
4.3.2如何使用R构建列联表53
4.4叠加有响应的柱状图54
4.4.1如何使用Python构建叠加柱状图55
4.4.2如何使用R构建叠加柱状图58
4.5基于预测值的分箱59
4.5.1如何使用Python基于预测值执行分箱61
4.5.2如何使用R基于预测值执行分箱63
4.6习题64
第5章为建模数据做准备69
5.1迄今完成的任务69
5.2数据分区69
5.2.1如何使用Python对数据进行分区70
5.2.2如何使用R对数据进行分区71
5.3验数据分区72
5.4平衡训练数据集73
5.4.1如何使用Python平衡训练数据集73
5.4.2如何使用R平衡训练数据集75
5.5建立模型能基准76
5.6习题78
第6章决策树81
6.1决策树简介81
6.2分类与回归树83
6.2.1如何使用Python构建CART决策树83
6.2.2如何使用R构建CART决策树86
6.3用于构建决策树的C5.0算法88
6.3.1如何使用Python构建C5.0决策树89
6.3.2如何使用R构建C5.0决策树90
6.4随机森林91
6.4.1如何使用Python构建随机森林92
6.4.2如何使用R构建随机森林92
6.5习题93
第7章模型评估97
7.1模型评估简介97
7.2分类评价措施97
7.3灵敏度和特异度99
7.4度、召回率和Fβ分数99
7.5模型评估方法100
7.6模型评估的应用示例100
7.7说明不对称的错误成本104
7.8比较考虑和不考虑不相等错误成本的模型106
7.9数据驱动的错误成本107
7.10习题110
第8章朴素贝叶斯分类113
8.1朴素贝叶斯简介113
8.2贝叶斯定理113
8.3优选化后验设14
8.4分类条件独立114
8.5朴素贝叶斯分类的应用115
8.5.1Python中的朴素贝叶斯120
8.5.2R中的朴素贝叶斯1
8.6习题126
第9章神经网络129
9.1神经网络简介129
9.2神经网络结构129
9.3连接权重和组合函数131
9.4sigmoid激活函数133
9.5反向传播133
9.6神经网络模型的应用134
9.7解释神经网络模型中的权重136
9.8如何在R中使用神经网络137
9.9习题138
0章聚类141
10.1聚类的定义141
10.2k均值聚类算法简介142
10.3k均值聚类的应用143
10.4簇验144
10.5如何使用Python执行k均值聚类145
10.6如何使用R执行k均值聚类147
10.7习题149
1章回归建模151
11.1估计任务151
11.2回归建模描述151
11.3多元回归建模的应用152
11.4如何使用Python执行多重回归建模154
11.5如何使用R执行多重回归建模156
11.6用于估计的模型评估158
11.6.1如何使用Python进行估计模型评估159
11.6.2如何使用R进行估计模型评估161
11.7逐步回归162
11.8回归的基准模型163
11.9习题164
2章降维169
12.1降维的必要169
12.2多重共线170
1.使用方差膨胀因子识别多重共线173
1..1如何使用Python识别多重共线174
1..2如何使用R识别多重共线175
12.4主成分分析177
12.5主成分分析的应用178
12.6我们应该提取多少分量179
12.6.1特征值准则179
12.6.2方差解释比例的准则180
12.7执行k=4的PCA180
12.8主成分分析的验181
12.9如何使用Python进行主成分分析182
12.10如何使用R进行主成分分析184
12.11何时多重共线不是问题187
12.12习题187
3章广义线模型191
13.1广义线模型概述191
13.2线回归是一种广义线模型192
13.3作为广义线模型的逻辑回归192
13.4逻辑回归模型的应用193
13.4.1如何使用Python执行逻辑回归194
13.4.2如何使用R执行逻辑回归195
13.5泊松回归196
13.6泊松回归模型的应用197
13.6.1如何使用Python执行泊松回归197
13.6.2如何使用R执行泊松回归199
13.7习题199
4章关联规则203
14.1关联规则简介203
14.2关联规则挖掘的简单示例203
14.3支持度、信任度和提升度204
14.4挖掘关联规则206
14.5确认我们的指标211
14.6置信差准则212
14.7置信商准则213
14.8习题215
附录A数据汇总与可视化219
"内容组织
《数据科学实战入门 使用Python 和R》一书基于数据科学方进行内容的组织。数据科学方法是一种在科学框架体系内进行数据分析的阶段、自适应和迭代式方法。
1. 问题理解阶段。首先,需要清晰地阐明项目目标;然后将这些目标转化为一种可以用数据科学解决的问题。
2. 数据准备阶段。数据清洗/准备阶段很可能是整个数据科学处理过程中很费力气的阶段。
● 相关内容参见第3 章:“数据准备”。
3. 探索数据分析阶段。在此阶段通过图形化探索方法获得对数据的初步认识。
● 相关内容参见第4 章:“探索数据分析”。
4. 设置阶段。建立数据模型的能基准,如果需要,可以对数据进行分割和平衡处理。
● 相关内容详见第5 章:“为建模数据做准备”。
5. 建模阶段。建模阶段是数据科学研究过程的核心,在此阶段应用各种优选的算法来发现隐藏在数据中的一些确实具有价值的关系。
● 相关内容参见第6 章以及8~4 章。
6. 评估阶段。确定设计的模型有价值,在此阶段需要从一系列可选的模型中选择能更佳的模型。
● 相关内容参见第7 章:“模型评估”。
7. 部署应用阶段。在此阶段需要与管理层协作来调整模型以适应实际部署。"
亲,大宗购物请点击企业用户渠道>小苏的服务会更贴心!
亲,很抱歉,您购买的宝贝销售异常火爆让小苏措手不及,请稍后再试~
非常抱歉,您前期未参加预订活动,
无法支付尾款哦!
抱歉,您暂无任性付资格