由于此商品库存有限,请在下单后15分钟之内支付完成,手慢无哦!
100%刮中券,最高50元无敌券,券有效期7天
活动自2017年6月2日上线,敬请关注云钻刮券活动规则更新。
如活动受政府机关指令需要停止举办的,或活动遭受严重网络攻击需暂停举办的,或者系统故障导致的其它意外问题,苏宁无需为此承担赔偿或者进行补偿。
正版 Alluxio 大数据统一存储原理与实践 范斌,顾荣 电子工业出版
¥ ×1
第 1 章 Alluxio 系统快速入门 ............................................................................................. 1
1.1 Alluxio 背景概述 ..................................................................................................... 1
1.1.1 Alluxio 系统功能简介 ................................................................................. 4
1.1.2 Alluxio 项目发展历史 ................................................................................. 5
1.2 获取/编译 Alluxio 软件 ........................................................................................... 6
1.2.1 下载预编译的 Alluxio 可执行包 ................................................................ 6
1.2.2 编译 Alluxio 源代码 .................................................................................... 6
1.3 Alluxio 的搭建部署及程序运行 ........................................................................... 10
1.3.1 单机模式 .................................................................................................... 10
1.3.2 集群模式 .................................................................................................... 13
1.3.3 高可用集群模式 ........................................................................................ 16
第 2 章 Alluxio 系统架构及读写工作机制 ....................................................................... 22
2.1 Alluxio 的构架简介与基本特征 ........................................................................... 22
2.1.1 提升远程存储读写性能 ............................................................................ 23
2.1.2 统一持久化数据访问接口 ........................................................................ 24
2.1.3 数据的快速复用和共享 ............................................................................ 26
2.2 Alluxio 的系统功能组件 ....................................................................................... 27
2.2.1 Alluxio Master 组件 ................................................................................... 27
2.2.2 Alluxio Worker 组件 .................................................................................. 29
2.2.3 Alluxio Client 组件 .................................................................................... 30
2.3 Alluxio 读写场景的行为分析 ............................................................................... 31
2.3.1 Alluxio 的读场景数据流 ........................................................................... 31
2.3.2 Alluxio 的写场景数据流 ........................................................................... 37
第 3 章 Alluxio 与底层存储系统的集成 ........................................................................... 40
3.1 配置 HDFS 作为 Alluxio 底层存储 ...................................................................... 40
3.1.1 准备步骤与基本配置流程 ........................................................................ 41
3.1.2 高级参数配置 ............................................................................................ 43
3.1.3 使用 HDFS 在本地运行 Alluxio ............................................................... 44
3.2 配置 Secure HDFS 作为 Alluxio 底层存储 .......................................................... 44
3.2.1 准备步骤与基本配置流程 ........................................................................ 45
3.2.2 使用安全认证模式 HDFS 在本地运行 Alluxio ....................................... 46
3.3 配置 AWS S3 作为 Alluxio 底层存储 .................................................................. 47
3.3.1 准备步骤与基本配置流程 ........................................................................ 47
3.3.2 高级参数配置 ............................................................................................ 49
3.3.3 使用 S3 在本地运行 Alluxio ..................................................................... 51
3.4 配置 Google GCS 作为 Alluxio 底层存储 ........................................................... 52
3.4.1 准备步骤与基本配置流程 ........................................................................ 52
3.4.2 高级参数配置 ............................................................................................ 53
3.4.3 使用 GCS 本地运行 Alluxio ..................................................................... 54
3.5 配置 Azure BLOB Store 作为 Alluxio 底层存储系统 ........................................ 55
3.5.1 准备步骤与基本配置流程 ........................................................................ 55
3.5.2 使用 Azure BLOB Store 本地运行 Alluxio .............................................. 57
第 4 章 Alluxio 与上层计算框架的集成 ........................................................................... 58
4.1 Alluxio 的管理员操作命令 ................................................................................... 58
4.1.1 操作命令列表 ............................................................................................ 59
4.1.2 操作命令示例 ............................................................................................ 59
4.2 Alluxio 的用户操作命令 ....................................................................................... 61
4.2.1 操作命令列表 ............................................................................................ 62
4.2.2 操作命令示例 ............................................................................................ 65
4.3 Alluxio 与 Hadoop 操作命令行的集成 ................................................................ 78
4.3.1 前期准备与配置 ........................................................................................ 78
4.3.2 具体使用示例 ............................................................................................ 79
4.4 Alluxio 与 Hadoop MapReduce 的集成 ................................................................ 79
4.4.1 前期准备与配置 ........................................................................................ 80
4.4.2 具体使用示例 ............................................................................................ 82
4.5 Alluxio 与 Spark 的集成 ....................................................................................... 83
4.5.1 前期准备与配置 ........................................................................................ 83
4.5.2 使用 Alluxio 作为输入/输出源 ................................................................. 85
4.5.3 Alluxio 与 Spark 集成常见问题分析与解决 ............................................ 86
4.6 Alluxio 与 Hive 的集成 ......................................................................................... 89
4.6.1 安装并配置 Hive 环境 .............................................................................. 89
4.6.2 使用 Alluxio 存储部分 Hive 表 ................................................................ 90
4.6.3 使用 Alluxio 作为默认文件系统(存储全部数据) .............................. 93
4.6.4 检查 Hive 和 Alluxio 的集成情况(支持 Hive 2.x) ............................. 95
4.7 Alluxio 与 Presto 的集成 ....................................................................................... 96
4.7.1 前期准备 .................................................................................................... 96
4.7.2 部署分发 Alluxio 客户端 jar 包 ................................................................ 98
4.7.3 Presto 操作命令示例 ................................................................................. 98
4.8 Alluxio 与 TensorFlow 的集成 ........................................................................... 100
4.8.1 深度学习面临的数据挑战 ...................................................................... 100
4.8.2 基于 Alluxio 解决深度学习存储问题的分析 ........................................ 101
4.8.3 安装并配置 Alluxio FUSE ..................................................................... 102
4.8.4 TensorFlow 使用 Alluxio FUSE 管理访问数据 ..................................... 103
第 5 章 Alluxio 基本功能的介绍与使用 ......................................................................... 105
5.1 Alluxio 系统环境与属性的配置 ......................................................................... 105
5.1.1 Alluxio 系统组件参数的配置 ................................................................. 106
5.1.2 Alluxio 客户端组件参数的配置 ............................................................. 109
5.1.3 Alluxio 参数配置的相关工具 ................................................................. 112
5.2 Alluxio 底层文件系统的配置与管理 ................................................................. 113
5.2.1 Alluxio 挂载底层存储 ............................................................................. 113
5.2.2 Alluxio 与底层存储的元数据一致性保证 ............................................. 116
5.3 Alluxio 缓存资源的配置与管理 ......................................................................... 120
5.3.1 配置 Alluxio 缓存存储资源 .................................................................... 121
5.3.2 Alluxio 缓存数据的载入、驻留及释放 ................................................. 126
5.3.3 配置 Alluxio 缓存数据的生存时间 ........................................................ 127
5.4 Alluxio 系统 Web 用户界面的查看与使用 ...................................................... 128
5.4.1 Alluxio Master Web 界面介绍 ................................................................ 128
5.4.2 Alluxio Worker Web 界面介绍 ............................................................... 134
第 6 章 Alluxio 高级功能的介绍与使用 ......................................................................... 137
6.1 Alluxio 的安全认证与权限控制 ......................................................................... 137
6.1.1 Alluxio 安全认证模式的介绍 ................................................................. 138
6.1.2 Alluxio 访问权限控制的介绍 ................................................................. 139
6.1.3 Alluxio 用户模拟功能的介绍 ................................................................. 141
6.1.4 Alluxio 审计日志功能的介绍 ................................................................. 142
6.2 Alluxio 的内置 Metrics 系统............................................................................... 143
6.3 Alluxio 文件系统日志的使用与维护 ................................................................. 145
6.4 Alluxio 系统的异常排查 ..................................................................................... 148
Alluxio: 大数据统一存储原理与实践
第 7 章 Alluxio 的应用案例与生产实践 ......................................................................... 152
7.1 陌陌基于 Alluxio 加速 Spark SQL 查询 ............................................................ 152
7.1.1 Alluxio 缓存应用背景简介 ..................................................................... 153
7.1.2 陌陌应用场景结合 Alluxio 的分析 ........................................................ 153
7.1.3 基于 Alluxio 的陌陌 Ad Hoc 查询系统架构 .......................................... 155
7.1.4 基于 Alluxio 的查询性能评估与分析 .................................................... 156
7.1.5 陌陌在 Alluxio 实战方面的后续实践 .................................................... 158
7.2 京东基于 Alluxio 和 Presto 构建交互式查询引擎 ............................................ 158
7.2.1 京东大数据平台的业务问题背景 .......................................................... 159
7.2.2 JDPresto on Alluxio 架构与特性的介绍 ................................................. 160
7.2.3 JDPresto on Alluxio 的性能评估与分析 ................................................. 161
7.2.4 JDPresto on Alluxio 的应用总结 ............................................................. 164
7.3 Alluxio 在携程实时计算平台中的应用与实践 ................................................. 165
7.3.1 携程实时计算的应用背景 ...................................................................... 165
7.3.2 基于 Alluxio 的跨集群数据共享方案与性能评估 ................................ 168
7.4 去哪儿网利用 Alluxio 提升异地存储访问性能 ................................................ 169
7.4.1 去哪儿网流式处理背景简介 .................................................................. 170
7.4.2 原有系统架构及相关问题分析 .............................................................. 171
7.4.3 基于 Alluxio 改进后的系统架构介绍与性能评估 ................................ 172
7.5 百度基于 Alluxio 加速远程数据读取 ................................................................ 176
7.5.1 百度跨机房数据查询问题的描述 .......................................................... 177
7.5.2 使用 Alluxio 缓存远端数据的方案与效果 ............................................ 177
7.5.3 使用 Alluxio 分层存储的方案与效果 .................................................... 178
7.5.4 基于 Alluxio 提速远程数据访问的总结 ................................................ 180
第 8 章 Alluxio 的开源社区开发者指南 ......................................................................... 181
8.1 Alluxio 的源代码规范 ......................................................................................... 181
8.1.1 源代码风格要求 ...................................................................................... 182
8.1.2 Alluxio 的单元测试 ................................................................................. 184
8.1.3 Alluxio 的日志系统 ................................................................................. 184
8.1.4 Alluxio 的 RPC 定义 ............................................................................... 186
8.1.5 Alluxio 文件系统日志消息 ..................................................................... 186
8.2 Alluxio 的单元测试流程介绍 ............................................................................. 187
8.2.1 运行 Alluxio 单元测试 ............................................................................ 187
8.2.2 创建 Alluxio 单元测试 ............................................................................ 188
8.2.3 单元测试需要避免的情况 ...................................................................... 190
8.2.4 Alluxio 单元测试的全局状态管理 ......................................................... 191
8.3 贡献源代码至 Alluxio 开源社区 ........................................................................ 193
8.3.1 开发者的系统要求和环境准备 .............................................................. 194
8.3.2 下载 Alluxio 源代码并配置开发者邮箱 ................................................ 194
8.3.3 编译 Alluxio 源代码 ................................................................................ 195
8.3.4 领取一个开发者新手任务 ...................................................................... 196
8.3.5 在本地副本中创建一个新的开发分支 .................................................. 196
8.3.6 提交本地的 commit ................................................................................. 197
8.3.7 提交一个社区 Pull Request ..................................................................... 198
8.3.8 审阅社区 Pull Request ............................................................................. 199
范斌,Alluxio开源项目管理委员会成员和源码维护者,Alluxio公司创始成员,现任开源副总裁;加入Alluxio项目之前就职于谷歌山景城,从事下一代大规模分布式存储系统的研究与开发,并荣获谷歌基础设施技术奖(Technical Infrastructure Award);2013年获得卡内基梅隆大学(Carnegie Mellon University)计算机系博士学位,攻读博士期间从事分布式系统算法和实现,是CuckooFilter、MemC3及高性能多线程KV库libcuckoo的一作者或联合作者,在SIGCOMM、SOSP、NSDI、CoNEXT等学术会议及IEEE Transactions on Networking等学术期刊上发表了论文;拥有多项专利,部分学术研究成果已在Alluxio、谷歌、Facebook、英特尔、微软等高科技公司落地使用。
√ Alluxio创始人及实践先驱联合力荐
√ 深度解密Alluxio核心概念与技术应用
√ 基于国内一线互联网企业真实案例技术剖析
√ 项目PMC&Maintainer凝聚钻研实力与超前视野
Alluxio能够面向集群计算框架(如Apache Spark和Hadoop MapReduce)提供一个抽象现有不同存储特点的存储层,从而支撑大数据存储系统的快速演进。这一点与IP层支撑了互联网的快速演进很类似。
Ion Stoica 加州大学伯克利分校教授,Apache Spark联合创始人
DataBricks公司联合创始人兼首席执行官,加州大学伯克利分校AMPLab共同负责人
大数据分析正在驱动分布式内存去满足实时流处理、交互式查询分析及图计算的新需求。我们很高兴能够与Alluxio社区的开发者一起工作,特别是优化Alluxio基于Intel平台的解决方案,这将帮助我们为客户创造出更具创新性且高性能的云和大数据解决方案。
Michael Greene 英特尔公司副总裁
作为世界上较大的互联网公司之一,百度不断面临着管理PB级规模数据带来的挑战。通过采用Alluxio等创新技术,我们能够帮助用户快速抽取出有意义、有价值的数据。我们部署的一个Alluxio集群超过了1000台workers,这也是世界上较大的Alluxio集群之一。Alluxio的层次化存储功能为我们提供了很好的管理大规模数据的灵活性。我们观察到,在支持交互式查询系统等业务时,能够取得平均10倍、至高30倍的性能提升,这有效地提升了做出重要商业决策的速度。
James Peng pony.ai创始人兼CEO,百度前首席架构师
随着云计算业务的发展,阿里巴巴集团管理着越来越多的大型数据中心。通过阿里云OSS与Alluxio的整合,以及其他阿里云服务产品的支撑,我们的用户可以利用新潮的硬件技术,以至高的性能运行重要作业。我们一直在为Alluxio开源社区做贡献,并且相信Alluxio会在未来的大数据架构中扮演重要的角色。
章文嵩 滴滴出行高级副总裁,阿里云前副总裁
LVS(Linux Virtual Server,Linux虚拟服务器)开源软件创始人
Alluxio是源自于AMPLab的一个具有重大影响力的开源项目。为了能够支撑不断拓展的大数据应用案例,存储层正在快速演进,Alluxio技术在其中扮演着具有重大颠覆性的角色。
Michael Franklin 加州大学伯克利分校AMPLab负责人
Alluxio 这一以内存为中心的分布式虚拟文件系统,最初诞生于加州大学伯克利分校的 AMPLab,其开源社区在目前大数据生态系统中发展很快。本书以广泛使用的 Alluxio 1.8.1 版本为基础进行编写,是一本全面介绍 Alluxio 相关技术原理与实践案例的书籍。本书主要内容包括 Alluxio 系统快速入门、Alluxio 系统架构及读写工作机制、Alluxio 与底层存储系统的集成、Alluxio 与上层计算框架的集成、Alluxio 基本功能和高级功能的介绍与使用。此外,本书还详细介绍了 Alluxio 的应用案例与生产实践,并详细解读了 Alluxio 的核心框架和技术应用,旨在为大数据从业人员和大数据存储技术爱好者提供一个深入学习的平台,也可用作开源社区开发者指南。
√ Alluxio创始人及实践先驱联合力荐
√ 深度解密Alluxio核心概念与技术应用
√ 基于国内一线互联网企业真实案例技术剖析
√ 项目PMC&Maintainer凝聚钻研实力与超前视野
亲,大宗购物请点击企业用户渠道>小苏的服务会更贴心!
亲,很抱歉,您购买的宝贝销售异常火爆让小苏措手不及,请稍后再试~
非常抱歉,您前期未参加预订活动,
无法支付尾款哦!
抱歉,您暂无任性付资格