新春将至,本公司假期时间为:2025年1月23日至2025年2月7日。2月8日订单陆续发货,期间带来不便,敬请谅解!
由于此商品库存有限,请在下单后15分钟之内支付完成,手慢无哦!
100%刮中券,最高50元无敌券,券有效期7天
活动自2017年6月2日上线,敬请关注云钻刮券活动规则更新。
如活动受政府机关指令需要停止举办的,或活动遭受严重网络攻击需暂停举办的,或者系统故障导致的其它意外问题,苏宁无需为此承担赔偿或者进行补偿。
全新正版大数据分析技术与实践教程9787030631657科学出版社
¥ ×1
新春将至,本公司假期时间为:2025年1月23日至2025年2月7日。2月8日订单陆续发货,期间带来不便,敬请谅解!
目录
**篇 大数据基础
章 大数据技术概述 1
1.1 理解大数据 1
1.1.1 大数据概念的提出 1
1.1.2 大数据概念的内涵 2
1.1.3 大数据的特征 2
1.1.4 大数据的数据类型 3
1.2 大数据处理流程 4
1.2.1 数据的采集与预处理 5
1.2.2 数据的存储与管理 7
1.. 数据的处理与分析 7
1.3 大数据关键技术 8
1.3.1 大数据的存储和管理 8
1.3.2 大数据的计算模式 9
1.3.3 大数据的分析方法 9
第2章 大数据存储与管理 10
2.1 分布式文件系统 10
2.1.1 分布式文件系统概述 10
2.1.2 几种比较流行的分布式文件系统 11
2.2 HDFS与Alluxi 2
2.2.1 HDFS 12
2.2.2 Alluxi 4
. 分布式数据库 17
..1 分布式数据库系统概述 17
..2 分布式数据库系统的特点 17
.. 分布式数据库系统的结构 18
..4 典型的分布式数据库系统 19
2.4 NoSL 9
2.4.1 NoSL概述 19
2.4.2 NoSL的设计原则 20
2.4.3 NoSL系统的技术特点 22
2.4.4 NoSL与NewSL的比较
2.5 HBase与Hive 25
2.5.1 HBase 25
2.5.2 Hive 29
2.5.3 Hive与HBase的比较 31
第3章 大数据计算模式 33
3.1 MapReduce计算 33
3.1.1 MapReduce概述 33
3.1.2 MapReduce模型 34
3.1.3 Hadoop中的MapReduce 34
3.2 流计算 36
3.2.1 流计算概述 36
3.2.2 流式大数据特征 37
3.. 流式计算系统关键技术 37
3.2.4 流式计算系统实例 39
3.3 图计算 43
3.3.1 图计算概述 43
3.3.2 分布式图计算 43
3.3.3 Pregel框架 45
3.3.4 Spark GraphX 46
第4章 大数据处理平台 48
4.1 Hadoop 48
4.1.1 简介 48
4.1.2 架构 48
4.1.3 工作过程 50
4.2 Spark 51
4.2.1 简介 51
4.2.2 架构 52
4.. 工作过程 52
4.3 各种产品化平台 53
4.3.1 国外的大数据处理平台 54
4.3.2 国内的大数据处理平台 56
第二篇 大数据分析
第5章 大数据分析概述 60
5.1 浅谈大数据分析 60
5.1.1 塔吉特的精准营销 60
5.1.2 Google流感预测 60
5.1.3 Netflix与纸牌屋 61
5.2 大数据分析基本流程 61
第6章 特征工程 63
6.1 特征工程概述 63
6.2 特征提取 63
6.2.1 特征及特征提取的概念 63
6.2.2 特征提取方法 64
6.3 特征预处理 67
6.3.1 特征预处理概述 67
6.3.2 特征缺失值处理 67
6.3.3 特征离散化 68
6.4 特征选择 69
6.4.1 特征选择概述 69
6.4.2 特征选择方法 70
6.5 特征降维 71
6.5.1 特征降维概述 71
6.5.2 特征降维方法 71
第7章 机器学习 73
7.1 回归分析 73
7.1.1 概念描述 73
7.1.2 线回归 74
7.1.3 广义线回归 76
7.2 聚类分析 77
7.2.1 概念描述 77
7.2.2 应用举例 78
7.. 聚类算法分类 78
7.2.4 代表聚类算法 80
7.3 分类分析 80
7.3.1 概念描述 80
7.3.2 常用分类算法 81
第8章 数据可视化 87
8.1 数据可视化概述 87
8.1.1 定义与概念 88
8.1.2 数据可视化标准 88
8.1.3 可视化的挑战与发展趋势 88
8.2 应用场景 90
8.3 开源工具 90
8.3.1 R可视化相关工具 91
8.3.2 Python可视化相关工具 94
8.3.3 D3.js插件 99
8.4 RealRec平台数据可视化介绍 100
8.4.1 力导向图 100
8.4.2 雷达图 101
8.4.3 和弦图 101
8.4.4 趋势分析图 102
8.4.5 箱线图 102
8.4.6 散点图 103
8.4.7 折线图 103
8.4.8 饼图 104
8.4.9 柱状图 104
第三篇 大数据实践
第9章 SDK与应用 105
9.1 Spark ML介绍 105
9.2 SDK接口介绍 107
9.3 开发环境搭建 107
9.4 项目结构与构建 109
9.5 新算法编程开发 114
9.6 算法打包与上传 119
9.7 算法应用与评估 122
0章 应用实践 124
10.1 实验一:水产品鲍鱼产量预测 124
10.2 实验二:高校贫困生识别 143
10.3 实验三:银行卡盗刷风险预警分析 161
10.4 实验四:电影票房预测 181
10.5 实验五:航空配餐预测 205
10.6 实验六:个化 226
10.7 实验七:风机预测维护
10.8 实验八:医保欺诈 259
1章 开放实验 261
11.1 实验一:就业局就业与失业大数据分析 261
11.2 实验二:客户流失大数据分析 278
随着人工智能和大数据时代的来临,和社会对相关领域人才的需求持续增长,很多学校创办了新的大数据专业。《大数据分析技术与实践教程》的编写是一种尝试,期望能从理论、方法到实践对大数据领域技术进行的覆盖。《大数据分析技术与实践教程》分为三篇:大数据基础篇对大数据的存储与管理、计算模式、处理平台等进行介绍;大数据分析篇按照分析流程介绍特征工程、机器学习和数据可视化的理论和方法;大数据实践篇通过在SaCa RealRec数据科学平台上完成的标准实验和两个开放实验指导学生完成真实数据集的分析与处理。
数据处理,高等学校,教材
亲,大宗购物请点击企业用户渠道>小苏的服务会更贴心!
亲,很抱歉,您购买的宝贝销售异常火爆让小苏措手不及,请稍后再试~
非常抱歉,您前期未参加预订活动,
无法支付尾款哦!
抱歉,您暂无任性付资格