由于此商品库存有限,请在下单后15分钟之内支付完成,手慢无哦!
100%刮中券,最高50元无敌券,券有效期7天
活动自2017年6月2日上线,敬请关注云钻刮券活动规则更新。
如活动受政府机关指令需要停止举办的,或活动遭受严重网络攻击需暂停举办的,或者系统故障导致的其它意外问题,苏宁无需为此承担赔偿或者进行补偿。
正版 实用预测分析 [美]拉尔夫·温特斯 机械工业出版社 978711160
¥ ×1
Contents 目 录
译者序
关于作者
关于审校者
前言
第1章预测分析入门 1
1.1许多行业中都有预测分析 2
1.1.1市场营销中的预测分析 2
1.1.2医疗中的预测分析 2
1.1.3其他行业中的预测分析 3
1.2技能和角色在预测分析中都很重要 3
1.3预测分析软件 4
1.3.1开源软件 5
1.3.2闭源软件 5
1.3.3和平共处 5
1.4其他有用的工具 5
1.4.1超越基础知识 6
1.4.2数据分析/研究 6
1.4.3数据工程 6
1.4.4管理 7
1.4.5数据科学团队 7
1.4.6看待预测分析的两种不同方式 7
1.5R 8
1.5.1CRAN 8
1.5.2安装R语言 8
1.5.3其他安装R语言的方法 8
1.6预测分析项目是如何组织的 9
1.7图形用户界面 10
1.8RStudio入门 11
1.8.1重新布局以保持和示例一致 11
1.8.2部分重要面板的简要描述 12
1.8.3创建新项目 13
1.9R语言控制台 14
1.10源代码窗口 15
1.11第一个预测模型 16
1.12第二个脚本 18
1.12.1代码描述 19
1.12.2predict函数 20
1.12.3检验预测误差 21
1.13 R语言包 22
1.13.1stargazer包 22
1.13.2安装stargazer包 23
1.13.3保存工作 24
1.14参考资料 24
1.15本章小结 24
第2章 建模过程 25
2.1结构化方法的优点 25
2.2分析过程方法 26
2.2.1CRISP-DM和SEMMA 27
2.2.2CRISP-DM和SEMMA的图表 27
2.2.3敏捷过程 28
2.2.4六西格玛和根本原因 28
2.2.5是否需要数据抽样 28
2.2.6使用所有数据 29
2.2.7比较样本与群体 29
2.3第一步:理解业务 30
2.4第二步:理解数据 36
2.4.1衡量尺度 36
2.4.2单变量分析 38
2.5第三步:数据准备 43
2.6第四步:建模 44
2.6.1具体模型说明 45
2.6.2逻辑回归 46
2.6.3支持向量机 47
2.6.4决策树 47
2.6.5降维技术 51
2.6.6主成分 51
2.6.7聚类 52
2.6.8时间序列模型 52
2.6.9朴素贝叶斯分类器 53
2.6.10文本挖掘技术 54
2.7第五步:评估 57
2.7.1模型验证 58
2.7.2曲线下面积 59
2.7.3样本内和样本外测试、前进测试 60
2.7.4训练/测试/验证数据集 60
2.7.5时间序列验证 61
2.7.6最佳冠军模型的基准测试 61
2.7.7专家意见:人与机器 61
2.7.8元分析 61
2.7.9飞镖板方法 61
2.8第六步:部署 62
2.9参考资料 62
2.10本章小结 62
第3章 输入和探索数据 64
3.1数据输入 64
3.1.1文本文件输入 65
3.1.2数据库表格 66
3.1.3电子表格文件 67
3.1.4XML和JSON数据 67
3.1.5生成你自己的数据 68
3.1.6处理大型文件的技巧 68
3.1.7数据整理 68
3.2连接数据 69
3.2.1使用sqldf函数 69
3.2.2生成数据 70
3.2.3检查元数据 71
3.2.4使用内部连接和外部连接来合并数据 72
3.2.5识别有多个购买记录的成员 73
3.2.6清除冗余记录 74
3.3探索医院数据集 74
3.3.1str(df)函数的输出 74
3.3.2View函数的输出 75
3.3.3colnames函数 75
3.3.4summary函数 76
3.3.5在浏览器中打开文件 77
3.3.6绘制分布图 77
3.3.7变量的可视化绘图 78
3.4转置数据帧 80
3.5缺失值 84
3.5.1建立缺失值测试数据集 84
3.5.2缺失值的不同类型 85
3.5.3纠正缺失值 87
3.5.4使用替换过的值运行回归 90
3.6替换分类变量 91
3.7异常值 91
3.7.1异常值为什么重要 91
3.7.2探测异常值 92
3.8数据转换 96
3.8.1生成测试数据 97
3.8.2Box-Cox转换 97
3.9变量化简/变量重要性 98
3.9.1主成分分析法 98
3.9.2全子集回归 102
3.9.3变量重要性 104
3.10参考资料 106
3.11本章小结 106
第4章 回归算法导论 107
4.1监督学习模型和无监督学习模型 108
4.1.1监督学习模型 108
4.1.2无监督学习模型 108
4.2回归技术 109
4.3广义线性模型 110
4.4逻辑回归 110
4.4.1比率 111
4.4.2逻辑回归系数 111
4.4.3示例:在医疗中使用逻辑回归来预测疼痛阈值 112
4.4.4GLM模型拟合 114
4.4.5检验残差项 115
4.4.6添加变量的分布图 116
4.4.7p值及其效应量 117
4.4.8p值及其影响范围 118
4.4.9变量选择 119
4.4.10交互 121
4.4.11拟合优度统计量 123
4.4.12置信区间和Wald统计 124
4.4.13基本回归诊断图 124
4.4.14分布图类型描述 124
4.4.15拟合优度:Hosmer-Lemeshow检验 126
4.4.16正则化 127
4.4.17示例:ElasticNet 128
4.4.18选择一个正确的Lambda 128
4.4.19基于Lambda输出可能的系数 129
4.5本章小结 130
第5章决策树、聚类和SVM导论 131
5.1决策树算法 131
5.1.1决策树的优点 131
5.1.2决策树的缺点 132
5.1.3决策树的基本概念 132
5.1.4扩展树 132
5.1.5不纯度 133
5.1.6控制树的增长 134
5.1.7决策树算法的类型 134
5.1.8检查目标变量 135
5.1.9在rpart模型中使用公式符号 135
5.1.10图的解释 136
5.1.11输出决策树的文本版本 137
5.1.12修剪 138
5.1.13渲染决策树的其他选项 139
5.2聚类分析 140
5.2.1聚类分析应用于多种行业 140
5.2.2什么是聚类 140
5.2.3聚类的类型 141
5.2.4k均值聚类算
拉尔夫·温特斯(Ralph Winters)目前在一家医疗服务公司担任数据架构师。他已经给很多名列世界500强的大企业提供过自己在统计和分析方面的经验,包括金融、市场营销、保险、医疗和制药领域的企业。他的工作包括很多不同类型的预测分析项目,包括客户保留、反洗钱、客户之声文本挖掘分析,以及医疗风险和客户选择模型。
以案例为驱动,重点介绍了各种数据分析和预测的技巧
拉尔夫·温特斯著的《实用预测分析/数据分析与决策技术丛书》由经验丰富的数据架构师撰写,着眼于提高开发、实行预测分析所需的六项关键实用技能,系统阐述应用预测分析的原理和技术,并通过大量来自市场营销、零售和医疗领域的真实案例,详细讲解使用R、Spark等开源工具进行预测分析的实用方法和技巧。全书共12章,靠前章概述预测分析的发展历史及在各行各业中的应用;第2章讨论两种重要分析方法:CRISP-DM和SEMMA;第3章介绍数据输入和数据探索的各种方法;第4章和第5章分别详细讨论四种核心预测算法,即回归、决策树、聚类和支持向量机(SVM);第6章介绍生存分析技术并展示如何使用生存分析来解释和预测客户流失;第7章介绍关联规则和购物篮分析的概念及其应用;第8章介绍时间序列分析;第9章介绍SparkR;靠前0章展示如何用SparkR和Spark SQL执行一些探索性数据分析;靠前1章介绍如何使用Spark实现逻辑回归和聚类;靠前2章讲解如何使用Stop和Frisk数据集在Spark中运行决策树模型。
亲,大宗购物请点击企业用户渠道>小苏的服务会更贴心!
亲,很抱歉,您购买的宝贝销售异常火爆让小苏措手不及,请稍后再试~
非常抱歉,您前期未参加预订活动,
无法支付尾款哦!
抱歉,您暂无任性付资格