- 商品参数
-
- 作者:
无著
- 出版社:图书其它
- 出版时间:2014.8
- ISBN:9782681737678
- 版权提供:图书其它
店铺公告
为保障消费者合理购买需求及公平交易机会,避免因非生活消费目的的购买货囤积商品,抬价转售等违法行为发生,店铺有权对异常订单不发货且不进行赔付。异常订单:包括但不限于相同用户ID批量下单,同一用户(指不同用户ID,存在相同/临近/虚构收货地址,或相同联系号码,收件人,同账户付款人等情形的)批量下单(一次性大于5本),以及其他非消费目的的交易订单。
温馨提示:请务必当着快递员面开箱验货,如发现破损,请立即拍照拒收,如验货有问题请及时联系在线客服处理,(如开箱验货时发现破损,所产生运费由我司承担,一经签收即为货物完好,如果您未开箱验货,一切损失就需要由买家承担,所以请买家一定要仔细验货)。
关于退货运费:对于下单后且物流已发货货品在途的状态下,原则上均不接受退货申请,如顾客原因退货需要承担来回运费,如因产品质量问题(非破损问题)可在签收后,联系在线客服。
书名: | MapReduce设计模式 |
作者: | (美)Donald Miner,(美)Adam Shook著 |
出版社: | 人民邮电出版社 |
出版日期: | 2014-09-01 |
版次: | 1版1次 |
ISBN: | 9787115360946 |
市场价: | 49.0 |
第1章 设计模式与MapReduce 1
1.1 设计模式 2
1.2 MapReduce简史 3
1.3 MapReduce和Hadoop简介 4
1.4 Hadoop示例:单词 6
1.5 Pig和Hive 10
第2章 概要模式 12
2.1 数值概要 12
2.1.1 模式描述 12
2.1.2 数值概要示例 16
2.2 倒排索引概要 30
2.2.1 模式描述 30
2.2.2 倒排索引示例 32
2.3 器 34
2.3.1 模式描述 34
2.3.2 器示例 36
第3章 过滤模式 39
3.1 过滤 40
3.1.1 模式描述 40
3.1.2 过滤示例 43
3.2 布隆过滤 45
3.2.1 模式描述 45
3.2.2 布隆过滤器示例 48
3.3 Top 10 53
3.3.1 模式描述 53
3.3.2 Top 10示例 58
3.4 去重 60
3.4.1 模式描述 60
3.4.2 去重示例 63
第4章 数据组织模式 65
4.1 分层结构 65
4.1.1 模式描述 65
4.1.2 分层结构示例 69
4.2 分区 76
4.2.1 模式描述 76
4.2.2 分区示例 79
4.3 分箱 81
4.3.1 模式描述 81
4.3.2 分箱示例 83
4.4 全排序 85
4.4.1 模式描述 85
4.4.2 全排序示例 88
4.5 混排 92
4.5.1 模式描述 92
4.5.2 混排示例 93
第5章 连接模式 96
5.1 连接简介 97
5.2 reduce端连接 102
5.2.1 模式描述 102
5.2.2 reduce端连接示例 104
5.2.3 使用布隆过滤器的reduce端连接 110
5.3 连接 112
5.3.1 模式描述 112
5.3.2 连接示例 114
5.4 组合连接 116
5.4.1 模式描述 116
5.4.2 组合连接示例 119
5.5 笛卡儿积 121
5.5.1 模式描述 121
5.5.2 笛卡儿积示例 124
第6章 元模式 131
6.1 作业链 131
6.1.1 关于驱动程序 132
6.1.2 作业链示例 133
6.1.3 关于shell脚本 142
6.1.4 关于JobControl 145
6.2 链折叠 149
6.2.1 ChainMapper方法和ChainReducer方法 153
6.2.2 链折叠示例 153
6.3 作业归并 158
作业归并示例 160
第7章 输入和输出模式 166
7.1 在Hadoop中自定义输入和输出 166
7.1.1 InputFormat 167
7.1.2 RecordReader 168
7.1.3 OutputFormat 169
7.1.4 RecordWriter 170
7.2 生成数据 170
7.2.1 模式描述 170
7.2.2 生成数据示例 172
7.3 外部源输出 177
7.3.1 模式描述 177
7.3.2 外部源输出示例 179
7.4 外部源输入 183
7.4.1 模型描述 183
7.4.2 外部源输入示例 185
7.5 分区裁剪 190
7.5.1 模式描述 190
7.5.2 分区裁剪示例 192
第8章 后的思考与设计模式的未来 203
8.1 数据的本质趋势 203
8.1.1 图像、音频和 203
8.1.2 流式数据 204
8.2 YARN的影响 204
8.3 作为库或者组件的模式 205
8.4 读者可以帮到什么 205
附录 布隆过滤器 207
MapReduce作为一种分布式海量数据处理的编程框架,已经得到业界的广泛关注。随着Hadoop的普及,MapReduce目前已经成为海量数据处理的基础但也是重要的方法之一。
《MapReduce设计模式》是一本关于设计模式的书,为读者提供解决问题的模板或通用指南。书中主要介绍编程模式,即如何利用MapReduce框架解决一类问题,重在提供解决问题的方法和思路。作者花大量篇幅介绍各种模式的原理及实现机制,并给出相应的应用实例,让读者对每种模式能有更直观的理解。
由于本书不会过多涉及底层框架及MapReduce API,所以希望读者阅读《MapReduce设计模式》之前,能够对Hadoop系统有所了解,知道如何编写MapReduce程序,并了解MapReduce程序框架的工作原理。《MapReduce设计模式》面向中MapReduce,涵盖了绝大部分MapReduce编程可能面对的场景,相信初学者和专家同样可以在本书中得到一些启示。
到目前为止,基于MapReduce框架的设计模式散见于各种研究论文、博客和书籍中。这本书将各种有价值的MapReduce设计模式汇集在一起,形成一本的合集,可以帮读者节省大量的时间和精力,无论读者身处哪个领域,使用哪种编程语言,使用什么开发框架。 书中对每一种模式都会详细解释其使用的上下文、可能存在的陷阱及使用的注意事项,以帮助读者在对大数据问题架构建模时避免常见的设计错误。本书还提供了MapReduce的一个完整综述,解释其起源和实现,并说明设计模式如此重要的原因。书中的所有示例代码都是基于Hadoop平台编写的。 “虽然MapReduce编程模型看似简单,但用来地解决实际问题还需要不同的思维方式。本书清晰地传达了只有经过多年实践积累才能获得的相关经验。” ——Tom White,Cloudera公司技术布道师,《Hadoop指南》作者 “真希望在我的职业生涯中早一些拥有这本书。解决我在MapReduce开发中遇到的几乎所有问题,都要用到这本书中的设计模式。” ——Lance Byrd,Hadoop MapReduce及分布式计算技术顾问及导师
1