由于此商品库存有限,请在下单后15分钟之内支付完成,手慢无哦!
100%刮中券,最高50元无敌券,券有效期7天
活动自2017年6月2日上线,敬请关注云钻刮券活动规则更新。
如活动受政府机关指令需要停止举办的,或活动遭受严重网络攻击需暂停举办的,或者系统故障导致的其它意外问题,苏宁无需为此承担赔偿或者进行补偿。
正版 大数据技术应用 编者:郑未//唐友钢|责编:程超群 电子工业出
¥ ×1
第1章 大数据概述
1.1 大数据的历史、现状与未来
1.1.1 大数据的历史
1.1.2 大数据的现状
1.1.3 大数据的未来
1.2 大数据的概念、特征与价值
1.2.1 大数据的概念
1.2.2 大数据的特征
1.2.3 大数据的价值
1.3 大数据的技术架构
1.4 大数据离线计算与实时计算
1.4.1 大数据离线计算
1.4.2 大数据实时计算
1.5 大数据下的数据驱动
1.6 本章小结
1.7 本章练习
第2章 初识Hadoop
2.1 Hadoop概述
2.2 Hadoop生态圈
2.3 Hadoop集群安装部署
2.3.1 集群环境准备
2.3.2 Hadoop集群的重要概念
2.3.3 伪分布模式安装
2.3.4 全分布模式安装
2.4 本章小结
2.5 本章练习
第3章 分布式文件系统——初识HDFS
3.1 HDFS概述
3.2 HDFS工作机制
3.2.1 HDFS通信机制
3.2.2 HDFS数据冗余机制
3.2.3 HDFS元数据管理机制
3.2.4 HDFS数据读写机制
3.2.5 HDFS异常恢复机制
3.2.6 HDFS安全模式机制
3.3 HDFS操作与编程接口
3.3.1 HDFS Web UI
3.3.2 HDFS Shell
3.3.3 HDFS Java API编程
3.4 本章小结
3.5 本章练习
第4章 分布式计算框架MapReduce
4.1 MapReduce概述
4.2 MapReduce运行机制
4.3 编程实现WordCount
4.4 MapReduce数据类型与输入/输出格式
4.5 文件切片
4.6 Shuffle机制详解
4.7 数据清洗案例
4.8 本章小结
4.9 本章练习
第5章 统一资源管理和调度框架YARN
5.1 YARN概述
5.2 YARN体系架构
5.3 YARN工作流程
5.4 YARN调度器与调度策略
5.5 本章小结
5.6 本章练习
第6章 分布式协调框架ZooKeeper
6.1 ZooKeeper概述
6.2 ZooKeeper系统模型
6.2.1 数据模型
6.2.2 集群模型
6.3 ZooKeeper核心机制
6.4 ZooKeeper典型应用
6.5 ZooKeeper安装部署
6.6 ZooKeeper Shell
6.7 本章小结
6.8 本章练习
第7章 数据仓库Hive
7.1 Hive概述
7.2 Hive体系架构
7.3 Hive安装部署
7.4 Hive数据类型
7.5 Hive文件格式
7.6 Hive数据模型
7.7 Hive函数
7.8 Hive实战
7.8.1 DDL操作
7.8.2 DML操作
7.8.3 WordCount详解
7.8.4 高级操作
7.9 本章小结
7.10 本章练习
第8章 日志采集工具Flume
8.1 Flume概述
8.2 Flume体系架构
8.3 Flume安装部署
8.4 Flume实战
8.5 本章小结
8.6 本章练习
第9章 工作流调度器Azkaban
9.1 Azkaban概述
9.2 Azkaban的安装部署
9.3 Azkaban实战
9.4 本章小结
9.5 本章练习
第10章 数据迁移工具Sqoop
10.1 Sqoop概述
10.2 Sqoop的安装部署
10.3 Sqoop实战
10.4 本章小结
10.5 本章练习
第11章 分布式列存储数据库HBase
11.1 HBase概述
11.2 HBase数据模型
11.3 HBase体系架构
11.4 HBase运行机制
11.5 HBase安装部署
11.6 HBase实战
11.6.1 HBase Shell
11.6.2 HBase Java API编程
11.6.3 HBase中使用过滤器Filter
11.6.4 HBase中使用MapReduce
11.7 HBase性能优化
11.7.1 数据库表设计优化
11.7.2 数据库读写优化
11.7.3 HBase参数设置优化
11.8 本章小结
11.9 本章练习
第12章 分布式消息队列Kafka
12.1 两种消息模型
12.2 Kafka架构与机制
12.3 Kafka的安装部署
12.4 Kafka实战
12.4.1 Kafka Shell
12.4.2 Kafka Java API
12.5 本章小结
12.6 本章练习
第13章 内存计算框架Spark
13.1 Spark概述
13.2 Spark体系架构
13.3 Spark安装部署
13.4 Spark客户端操作
13.5 Spark RDD
13.5.1 Spark RDD概述
13.5.2 Spark RDD算子
13.5.3 Spark RDD依赖关系
13.5.4 Spark RDD缓存
13.6 Spark SQL
13.6.1 Spark SQL概述
13.6.2 Spark SQL DataFrame/DataSet
13.6.3 Spark SQL编程
13.6.4 Spark操作JDBC
13.6.5 Spark操作Hive
13.7 Spark Streaming
13.7.1 Spark Streaming概述
13.7.2 Spark Streaming实现实时WordCount
13.7.3 Spark Streaming整合Flume
13.7.4 Spark Streaming整合Kafka
13.8 本章小结
13.9 本章练习
第14章 大数据平台的管理与监控
14.1 平台管理与监控概述
14.2 Nagios介绍
14.3 Ganglia介绍
14.4 Cacti介绍
14.5 JMX介绍
14.6 本章小结
14.7 本章练习
第15章 大数据离线计算项目
15.1 项目概述
15.2 需求分析与项目设计
15.3 数据预处理
15.4 数据分析并导出结果到MySQL
15.5 数据可视化
15.6 本章小结
15.7 本章练习
第16章 大数据实时计算项目
16.1 项目概述
16.2 需求分析与项目设计
16.3 数据采集到消息中间件
16.4 数据实时计算并保存到Redis
16.5 数据可视化
16.6 本章小结
16.7 本章练习
附录A 部分练习参考答案及解析
参考文献
本书是“大数据应用开发(Java)”1+X职业技能等级证书配套教材,同时也是蓝桥学院“Java全栈工程师”培养项目配套教材。全书共16章,包括大数据概述、Hadoop、HDFS、MapReduce、YARN、ZooKeeper、Hive、Flume、Azkaban、Sqoop、HBase、Kafka、Spark、大数据平台的管理与监控、大数据离线计算项目和大数据实时计算项目。本书从零基础开始逐一讲解大数据体系中的各种技术,通过丰富的实战案例阐述重点、难点知识,为初学者进入大数据领域打好基础。各章节设计合理,在每章开头设置本章简介,在知识点介绍后紧跟实践操作,在每章的末尾对重要内容进行了概括性回顾并通过练习帮助读者巩固相关知识。本书配套资源丰富,在蓝桥在线学习平台(www.lanqiao.cn/oneplusx)上汇集了微课、实验等多种学习资源。
本书直接服务于“大数据应用开发(Java)”1+X职业技能等级证书工作,也可作为职业院校、应用型本科院校计算机应用技术、软件技术、软件工程、网络工程和大数据应用技术等计算机类专业的教材,还可供从事计算机相关工作的技术人员参考。
亲,大宗购物请点击企业用户渠道>小苏的服务会更贴心!
亲,很抱歉,您购买的宝贝销售异常火爆让小苏措手不及,请稍后再试~
非常抱歉,您前期未参加预订活动,
无法支付尾款哦!
抱歉,您暂无任性付资格