实名认证领苏宁支付券立即领取 >
¥
提前抢
SUPER会员专享
由于此商品库存有限,请在下单后15分钟之内支付完成,手慢无哦!
欢迎光临本店铺
点我可查看更多商品哦~
100%刮中券,最高50元无敌券,券有效期7天
亲,今日还有0次刮奖机会
我的云钻:0
您的云钻暂时不足,攒足云钻再来刮
恭喜获得1张券!
今天的机会已经全部用完了,请明天再来
恭喜刮出两张券,请选择一张领取
活动自2017年6月2日上线,敬请关注云钻刮券活动规则更新。
如活动受政府机关指令需要停止举办的,或活动遭受严重网络攻击需暂停举办的,或者系统故障导致的其它意外问题,苏宁无需为此承担赔偿或者进行补偿。
全新Hadoop大数据挖掘从入门到进阶实战邓杰 编著9787111600107
¥ ×1
商品
服务
物流
前言章 集群及开发环境搭建11.1 环境准备11.1.1 基础软件下载11.1.2 准备Linux操作系统21.2 安装Hadoop41.2.1 基础环境配置41.2.2 Zookeeper部署71.. Hadoop部署91.2.4 效果验211.2.5 集群架构详解241.3 Hadoop版Hello World251.3.1 Hadoop Shell介绍251.3.2 WordCount初体验271.4 开发环境281.4.1 搭建本地开发环境281.4.2 运行及调试预览311.5 小结34第2章 实战:快速构建一个Hadoop项目并线上运行352.1 构建一个简单的项目工程352.1.1 构建Java Project结构工程352.1.2 构建Maven结构工程362.2 操作分布式文件系统(HDFS)392.2.1 基本的应用接口操作392.2.2 在高可用平台上的使用方法42. 利用E提交MapReduce作业43..1 在单点上的操作43..2 在高可用平台上的操作462.4 编译应用程序并打包512.4.1 编译Java Project工程并打包512.4.2 编译Maven工程并打包552.5 部署与调度582.5.1 部署应用582.5.2 调度任务592.6 小结60第3章 Hadoop套件实战613.1 Sqoop——数据传输工具613.1.1 背景概述613.1.2 安装及基本使用623.1.3 实战:在关系型数据库与分布式文件系统之间传输数据643.2 Flume——日志收集工具663.2.1 背景概述673.2.2 安装与基本使用673.. 实战:收集系统日志并上传到分布式文件系统(HDFS)上723.3 HBase——分布式数据库743.3.1 背景概述743.3.2 存储架构介绍753.3.3 安装与基本使用753.3.4 实战:对HBase业务表进行增、删、改、查操作793.4 Zeppelin——数据集分析工具853.4.1 背景概述853.4.2 安装与基本使用853.4.3 实战:使用解释器操作不同的数据处理引擎883.5 Drill——低SL查询引擎923.5.1 背景概述933.5.2 安装与基本使用933.5.3 实战:对分布式文件系统(HDFS)使用SL进行查询953.5.4 实战:使用SL查询HBase数据库993.5.5 实战:对数据仓库(Hive)使用类实时统计、查询操作1013.6 Spark——实时流数据计算1043.6.1 背景概述1043.6.2 安装部署及使用1053.6.3 实战:对接Kafka消息数据,消费、计算及落地1083.7 小结114第4章 Hive编程——使用SL提交MapReduce任务到Hadoop集群1154.1 环境准备与Hive初识1154.1.1 背景介绍1154.1.2 基础环境准备1164.1.3 Hive结构初识1164.1.4 Hive与关系型数据库(RDBMS)1184.2 安装与配置Hive1184.2.1 Hive集群基础架构1194.2.2 利用HAProxy实现Hive Server负载均衡1204.. 安装分布式Hive集群14.3 可编程方式1264.3.1 数据类型1264.3.2 存储格式1284.3.3 基础命令1294.3.4 Java编程语言操作数据仓库(Hive)1314.3.5 实践Hive Streaming1344.4 运维和监控1384.4.1 基础命令1384.4.2 监控工具Hive Cube1404.5 小结143第5章 游戏玩家的用户行为分析——特征提取1445.1 项目应用概述1445.1.1 场景介绍1445.1.2 平台架构与数据采集1455.1.3 准备系统环境和软件1475.2 分析与设计1485.2.1 整体分析1485.2.2 指标与数据源分析1495.. 整体设计1515.3 技术选型1535.3.1 套件选取简述1545.3.2 套件使用简述1545.4 编码实践1575.4.1 实现代码1575.4.2 统计结果处理1635.4.3 应用调度1695.5 小结174第6章 Hadoop平台管理与维护1756.1 Hadoop分布式文件系统(HDFS)1756.1.1 HDFS特1756.1.2 基础命令详解1766.1.3 解读NameNode Standby1796.2 Hadoop平台监控1826.2.1 Hadoop日志1836.2.2 常用分布式监控工具1876.3 平台维护1966.3.1 安全模式1966.3.2 节点管理1986.3.3 HDFS快照2006.4 小结203第7章 Hadoop异常处理解决方案2047.1 定位异常2047.1.1 跟踪日志2047.1.2 分析异常信息2087.1.3 阅读开发业务代码2097.2 解决问题的方式2107.2.1 搜索关键字2117.2.2 查看Hadoop JIRA2127.. 阅读相关源码2137.3 实战案例分析2167.3.1 案例分析1:启动HBase失败2167.3.2 案例分析2:HBase表查询失败2197.3.3 案例分析3:Spark的临时数据不自动清理2227.4 小结2第8章 初识Hadoop核心源码2248.1 基础准备与源码编译2248.1.1 准备环境2248.1.2 加载源码2288.1.3 编译源码08.2 初识Hadoop 28.2.1 Hadoop的起源8.2.2 Hadoop 2源码结构图48.. Hadoop模块包58.3 MapReduce框架剖析8.3.1 代MapReduce框架8.3.2 第二代MapReduce框架8.3.3 两代MapReduce框架的区别8.3.4 第二代MapReduce框架的重构思路2408.4 序列化2418.4.1 序列化的由来2428.4.2 Hadoop序列化2438.4.3 Writable实现类2458.5 小结247第9章 Hadoop通信机制和内部协议2489.1 Hadoop RPC概述2489.1.1 通信模型2489.1.2 Hadoop RPC特点250……
邓杰,博客园资历博主,资历大数据全栈开发者,极客学院大数据讲师,开源爱好者。善于开发大数据监控系统辅日常工作,提升工作效率。开发了大数据自类平台系统。开发并在GiHb发布了Kafka系统监控管理工具Kafka Eagle,深受业内开发者的赞誉。作为极客学院特邀讲师,制作了多个技术视频,讲授Hadoop和Kafka等相关技术课程,广受学员。
前言 大数据时代,数据的存储与挖掘至关重要。企业在追求高可靠、扩展及容错的大数据处理平台的同时还希望能够降低成本,而Hadoop为实现这些需求提供了解决方案。 Hadoop在分布式计算与存储上具有先天优势。它作为Apache软件会的开源项目,其版本迭代持续至今,而且已经拥有一个活跃的社区和全球众多开发者,并且成为了当前流行的大数据处理平台。很多公司,特别是互联网公司,都纷纷开始使用或者已经使用Hadoop来做海量数据存储与数据挖掘。 Hadoop简单易学,其学曲线缓且学习周期短。它的操作命令和Linux命令相似。一个熟悉Linux的开发者只需要短短的一周时间,就可以学会Hadoop开发,完成一个高可用集群的部署和高可用应用程序的编写。 面对Hadoop的普及和学习热潮,笔者愿意分享自己多年的开发经验,带领读者比较轻松地掌握Hadoop数据挖掘的相关知识。这便是笔者编写本书的原因。本书使用通俗易懂的语言进行讲解,从基础部署到集群的管理,再到底层设计等内容均有涉及。通过阅读本书,读者可以较为轻松地掌握Hadoop大数据挖掘与分析的相关技术。 本书特色 1.提供专业的配套教学视频,高效、直观 笔者曾接受过极客学院的专业视频制作指导,并在极客学院录制过多期Hadoop和Kafka实战教学视频课程,得到了众多学习者的青睐及。为了便于读者更加高效、直观地学习本书内容,笔者特意为本书实战部分的内容录制了配套教学视频,读者可以在教学视频的辅下学,从而更加轻松地掌握Hadoop。 2.分享大量来自一线的开发经验,贴近实际开发 本书给出的代码讲解和实例大多数来自于笔者多年的教学积累和技术分享,几乎都是得到了学习者一致的干货。另外,笔者还是一名开源爱好者,编写了业内著名的Kafka Eagle监控系统。本书3章介绍了该系统的使用,以帮读者掌握如何监控大数据集群的相关知识。 3.分享多个来自一线的实例,有很强的实用 本书精心挑选了多个实用很强的例子,如Hadoop套件实战、Hive编程、Hadoop平台管理与维护、ELK实战和Kafka实战等。读者不但可以从这些例子中学习和理解Hadoop及其套件的相关知识点,而且还可以将这些例子应用于实际开发中。 4.讲解通俗易懂,力争触类旁通,举一反三 本书用通俗易懂的语言讲解,避免“云山雾罩”,让读者不知所云。书中在讲解一些常用知识点时将Hadoop命令与Linu命令行了对比,便于熟悉Linux命令的读者能够迅速掌握Hadoop的操作命令。 本书内容 章 集群及开发环境搭建 本章介绍的主要内容包括:环境准备;安装Hadoop;演示Hadoop版Hello World示例程序,以及搭建Hadoop开发环境。 第2章 实战:快速构建一个Hadoop项目并线上运行 本章首先介绍了快速构建项目工程的方法,如Maven和Java Project;然后介绍了分布式文件系统的操作命令,以及利用E提交MapReduce作业的相关知识;介绍了编译应用程序并打包,以及部署与调度等内容。 第3章 Hadoop套件实战 本章介绍了Hadoop生态圈中常见的大数据套件的背景知识和使用方法,涵盖Sqoop、Flume、HBase、Zeppelin、Drill及Spark等套件。 第4章 Hive编程——使用SL提交MapReduce任务到Hadoop集群 本章主要介绍了Hive数据仓库的相关内容:Hive底层设计组成;安装和配置Hive;基于Hive应用接口进行编程;开源监控工具Hive Cube。 第5章 游戏玩家的用户行为分析——特征提取 本章首先对Hadoop的基础知识进行了梳理;然后介绍了项目的背景和平台架构;接着对项目进行了整体分析与指标设计,并进行了技术选型;对分析的指标进行了编码实践。 第6章 Hadoop平台管理与维护 本章介绍了Hadoop平台管理与维护的重要方法。本章首先介绍了Hadoop分布式文件系统的特,然后介绍了HDFS的基础命令,并对NameNode进行了解读。另外,本章对Hadoop平台维护时的常规操作,如节点管理、HDFS快照和安全模式等内容也进行了讲解。 第7章 Hadoop异常处理解决方案 本章介绍了Hadoop异常处理解决方案的几个知识点。主要内容包括:跟踪日志;分析异常信息;利用搜索引擎检索关键字;查看Hadoop JIRA;阅读Hadoop源代码。 本章以实战案例的形式分析了几种异常情况:启动HBase集群失败;HBase表查询失败;Spark的临时数据不自动清理等。 第8章 初识Hadoop核心源码 本章首先介绍了Hadoop源码基础环境准备及源代码编译;接着介绍了Hadoop的起源和两代MapReduce框架间的差异;介绍了Hadoop的序列化机制。 第9章 Hadoop通信机制和内部协议 本章首先介绍了Hadoop通信模型和Hadoop RPC的特点;然后通过编码实践介绍了Hadoop RPC的使用,同时还介绍了与之类似的开源RPC框架;介绍了MapReduce的通信协议和RPC协议的实现过程。 0章 Hadoop分布式文件系统剖析 本章主要介绍了Hadoop分布式文件系统的设计特点、命令空间和节点、数据备份策略
抢购价:¥ 38.00
易购价:¥ 38.00
注:参加抢购将不再享受其他优惠活动
亲,很抱歉,您购买的宝贝销售异常火爆,让小苏措手不及,请稍后再试~
验证码错误
看不清楚?换一张
确定关闭
亲,大宗购物请点击企业用户渠道>小苏的服务会更贴心!
亲,很抱歉,您购买的宝贝销售异常火爆让小苏措手不及,请稍后再试~
查看我的收藏夹
非常抱歉,您前期未参加预订活动,无法支付尾款哦!
关闭
抱歉,您暂无任性付资格
继续等待
0小时0分
立即开通
SUPER会员