由于此商品库存有限,请在下单后15分钟之内支付完成,手慢无哦!
100%刮中券,最高50元无敌券,券有效期7天
活动自2017年6月2日上线,敬请关注云钻刮券活动规则更新。
如活动受政府机关指令需要停止举办的,或活动遭受严重网络攻击需暂停举办的,或者系统故障导致的其它意外问题,苏宁无需为此承担赔偿或者进行补偿。
正版 深入理解大数据 大数据处理与编程实践 黄宜华 苗凯翔 高等学校系列教材 9787111473251 机械工业出
¥ ×1
商品基本信息 | |
商品名称: | 深入理解大数据:大数据处理与编程实践 |
作者: | 主编:黄宜华(南京大学) |
市场价: | 79.00 |
ISBN号: | 9787111473251 |
版次: | 1-1 |
出版日期: | 2014-07 |
页数: | 488 |
字数: | |
出版社: | 机械工业出版社 |
目录 | |
目 录 推荐序一 推荐序二 推荐序三 丛书序言 前 言 第一部分 Hadoop系统 第1章 大数据处理技术简介 2 1.1 并行计算技术简介 2 1.1.1 并行计算的基本概念 2 1.1.2 并行计算技术的分类 6 1.1.3 并行计算的主要技术问题 10 1.2 大数据处理技术简介 13 1.2.1 大数据的发展背景和研究意义 13 1.2.2 大数据的技术特点 16 1.2.3 大数据研究的主要目标、基本原则和基本途径 17 1.2.4 大数据计算模式和系统 18 1.2.5 大数据计算模式的发展趋势 21 1.2.6 大数据的主要技术层面和技术内容 22 1.3 MapReduce并行计算技术简介 25 1.3.1 MapReduce的基本概念和由来 25 1.3.2 MapReduce的基本设计思想 26 1.3.3 MapReduce的主要功能和技术特征 28 1.4 Hadoop系统简介 30 1.4.1 Hadoop的概述与发展历史 30 1.4.2 Hadoop系统分布式存储与并行计算构架 31 1.4.3 Hadoop平台的基本组成与生态系统 33 1.4.4 Hadoop的应用现状和发展趋势 37 第2章 Hadoop系统的安装与操作管理 39 2.1 Hadoop系统安装方法简介 39 2.2 单机和单机伪分布式Hadoop系统安装基本步骤 39 2.2.1 安装和配置JDK 40 2.2.2 创建Hadoop用户 40 2.2.3 下载安装Hadoop 40 2.2.4 配置SSH 41 2.2.5 配置Hadoop环境 42 2.2.6 Hadoop的运行 43 2.2.7 运行测试程序 43 2.2.8 查看集群状态 44 2.3 集群分布式Hadoop系统安装基本步骤 44 2.3.1 安装和配置JDK 44 2.3.2 创建Hadoop用户 45 2.3.3 下载安装Hadoop 45 2.3.4 配置SSH 45 2.3.5 配置Hadoop环境 46 2.3.6 Hadoop的运行 48 2.3.7 运行测试程序 48 2.3.8 查看集群状态 49 2.4 Hadoop MapReduce程序开发过程 49 2.5 集群远程作业提交与执行 53 2.5.1 集群远程作业提交和执行过程 53 2.5.2 查看作业执行结果和集群状态 53 第3章 大数据存储——分布式文件系统HDFS 56 3.1 HDFS的基本特征与构架 56 3.1.1 HDFS的基本特征 57 3.1.2 HDFS的基本框架与工作过程 57 3.2 HDFS可靠性设计 60 3.2.1 HDFS数据块多副本存储设计 60 3.2.2 HDFS可靠性的设计实现 61 3.3 HDFS文件存储组织与读写 63 3.3.1 文件数据的存储组织 63 3.3.2 数据的读写过程 65 3.4 HDFS文件系统操作命令 68 3.4.1 HDFS启动与关闭 68 3.4.2 HDFS文件操作命令格式与注意事项 69 3.4.3 HDFS文件操作命令 69 3.4.4 高级操作命令和工具 77 3.5 HDFS基本编程接口与示例 83 3.5.1 HDFS编程基础知识 83 3.5.2 HDFS基本文件操作API 84 3.5.3 HDFS基本编程实例 87 第4章 Hadoop MapReduce并行编程框架 91 4.1 MapReduce基本编程模型和框架 91 4.1.1 MapReduce并行编程抽象模型 91 4.1.2 MapReduce的完整编程模型和框架 93 4.2 Hadoop MapReduce基本构架与工作过程 96 4.2.1 Hadoop系统构架和MapReduce程序执行过程 96 4.2.2 Hadoop MapReduce执行框架和作业执行流程 98 4.2.3 Hadoop MapReduce作业调度过程和调度方法 102 4.2.4 MapReduce执行框架的组件和执行流程 106 4.3 Hadoop MapReduce主要组件与编程接口 107 4.3.1 数据输入格式InputFormat 107 4.3.2 输入数据分块InputSplit 109 4.3.3 数据记录读入RecordReader 110 4.3.4 Mapper类 112 4.3.5 Combiner 114 4.3.6 Partitioner 115 4.3.7 Sort 116 4.3.8 Reducer类 119 4.3.9 数据输出格式OutputFormat 120 4.3.10 数据记录输出RecordWriter 122 第5章 分布式数据库HBase 123 5.1 HBase简介 123 5.1.1 为什么需要NoSQL数据库 123 5.1.2 HBase的作用和功能特点 125 5.2 HBase的数据模型 126 5.2.1 HBase的基本数据模型 126 5.2.2 HBase的查询模式 128 5.2.3 HBase表设计 129 5.3 HBase的基本构架与数据存储管理方法 132 5.3.1 HBase在Hadoop生态中的位置和关系 132 5.3.2 HBase的基本组成结构 133 5.3.3 HBase Region 133 5.3.4 Region Server 135 5.3.5 HBase的总体组成结构 138 5.3.6 HBase的寻址和定位 139 5.3.7 HBase节点的上下线管理 142 5.4 HBase安装与操作 145 5.4.1 安装一个单机版的HBase 145 5.4.2 HBase Shell操作命令 146 5.4.3 基于集群的HBase安装和配置 149 5.5 HBase的编程接口和编程示例 152 5.5.1 表创建编程接口与示例 152 5.5.2 表数据更新编程接口与示例 153 5.5.3 数据读取编程接口与示例 155 5.5.4 HBase MapReduce支持和编程示例 157 5.6 HBase的读写操作和特性 161 5.6.1 HBase的数据写入 161 5.6.2 HBase的数据读取 171 5.7 其他HBase功能 173 5.7.1 Coprocessor 173 5.7.2 批量数据导入Bulk Load 176 第6章 分布式数据仓库Hive 179 6.1 Hive的作用与结构组成 179 6.2 Hive的数据模型 181 6.2.1 Hive的数据存储模型 181 6.2.2 Hive的元数据存储管理 182 6.2.3 Hive的数据类型 183 6.3 Hive的安装 184 6.3.1 下载Hive安装包 184 6.3.2 配置环境变量 184 6.3.3 创建Hive数据文件目录 185 6.3.4 修改Hive配置文件 185 6.4 Hive查询语言——HiveQL 188 6.4.1 DDL语句 188 6.4.2 DML语句 189 6.4.3 SELECT查询语句 190 6.4.4 数据表操作语句示例 190 6.4.5 分区的使用 192 6.4.6 桶的使用 193 6.4.7 子查询 194 6.4.8 Hive的优化和高级功能 194 6.5 Hive JDBC编程接口与程序设计 196 第7章 Intel Hadoop系统优化与功能增强 200 7.1 Intel Hadoop系统简介 200 7.1.1 Intel Hadoop系统的主要优化和增强功能 200 7.1.2 Intel Hadoop的系统构成与组件 201 7.2 Intel Hadoop系统的安装和管理 202 7.3 Intel Hadoop HDFS的优化和功能扩展 202 7.3.1 HDFS的高可用性 203 7.3.2 Intel Hadoop系统高可用性配置服务 204 7.3.3 Intel Hadoop系统高可用性配置服务操作 206 7.3.4 自适应数据块副本调整策略 208 7.4 Intel Hadoop HBase的功能扩展和编程示例 211 7.4.1 HBase大 |
内容简介 | |
本书从HadoopMapReduce并行计算技术与系统的基本原理剖析着手,在系统介绍基本工作原理、编程模型、编程框架和接口的基础上,着重系统化地介绍MapReduce并行算法设计与编程技术,较为全面地介绍了基本MapReduce算法设计、高级MapReduce编程技术、以及一系列较为复杂的机器学习和数据挖掘并行化算法,并引入来自IntelHadoop系统产品的一系列增强功能以及深度技术剖析;最后,为了提高读者的算法设计与编程实战能力,本书较为详细地介绍了一系列综合性和实战性大数据处理和算法设计问题,这些问题来自课程同学参加的全国性大数据大赛中的获奖算法、课程中的优秀课程设计、以及来自本团队的科研课题及业界实际的大数据应用实战案例。 |
亲,大宗购物请点击企业用户渠道>小苏的服务会更贴心!
亲,很抱歉,您购买的宝贝销售异常火爆让小苏措手不及,请稍后再试~
非常抱歉,您前期未参加预订活动,
无法支付尾款哦!
抱歉,您暂无任性付资格