返回首页
苏宁会员
购物车 0
易付宝
手机苏宁

服务体验

店铺评分与同行业相比

用户评价:----

物流时效:----

售后服务:----

  • 服务承诺: 正品保障
  • 公司名称:
  • 所 在 地:

  • Spark大数据编程实用教程 艾叔 编 专业科技 文轩网
  • 新华书店正版
    • 作者: 暂无著
    • 出版社: 机械工业出版社
    • 出版时间:2020-05-01 00:00:00
    送至
  • 由""直接销售和发货,并提供售后服务
  • 加入购物车 购买电子书
    服务

    看了又看

    商品预定流程:

    查看大图
    /
    ×

    苏宁商家

    商家:
    文轩网图书旗舰店
    联系:
    • 商品

    • 服务

    • 物流

    搜索店内商品

    商品分类

         https://product.suning.com/0070067633/11555288247.html

     

    商品参数
    • 作者: 暂无著
    • 出版社:机械工业出版社
    • 出版时间:2020-05-01 00:00:00
    • 版次:1
    • 印次:1
    • 印刷时间:2020-05-01
    • 字数:591000
    • 页数:373
    • 开本:16开
    • 装帧:平装
    • ISBN:9787111651000
    • 国别/地区:中国
    • 版权提供:机械工业出版社

    Spark大数据编程实用教程

    作  者:艾叔 编
    定  价:109
    出 版 社:机械工业出版社
    出版日期:2020年05月01日
    页  数:373
    装  帧:平装
    ISBN:9787111651000
    主编推荐

    跟艾叔学习Spark,全面掌握Spark编程技能,快速成为合格的大数据工程师!Spark编程全国总决赛等奖团队实战总结,提供Spark快速学习路线图。11个综合实践案例和110个余个具体示例,透彻讲解Spark编程方法。免费提供高清学习视频及电子书(涵盖虚拟机、Linux、Shell编程及Scala语言),一站式全方位夯实大数据开发基础。

    内容简介

    本书是一本讲解Spark基础应用及编程的实用教程,基于Spark 2.3版本,内容包括Spark与大数据、构建Spark运行环境、开发一个Spark程序、深入理解Spark程序代码、RDD编程、Spark SQL结构化数据处理、Spark Streaming、Structured Streaming、SparkR和GraphX。本书总结了Spark学习的关键点;提出了Spark快速学习路线图;提供配套的Spark前置课程学习资源链接,包括虚拟机、Linux和Shell免费高清视频、《零基础快速入门Scala》免费电子书等,帮助零基础读者迅速夯实Spark基础。 本书配以大量的示例、源代码和注释,可以帮助读者快速、全面而又深入地掌握Spark编程技能。本书既可作为高等院校大数据、云计算和人工智能相关专业的教材,也可以作为Spark学习者和大数据研发人员的技术参考书。

    作者简介

    文艾(艾叔):系统分析师,原解放军理工大学-奇虎360联合实验室技术负责人;具有多年大数据开发和运维经验,带领团队完成了与华为、中兴通讯和奇虎360等公司的多个大数据类项目;曾受邀为中兴通讯和奇虎360等公司做技术培训,其主讲的Spark课程长期排名51CTO学院大数据类(Spark分类)年销量前列;擅长帮助初学者快速掌握Spark大数据编程技能,近年来指导零基础本科生参加Spark类全国编程竞赛,战胜了多支985高校的研究生队,获得全国总决赛二等奖两次和三等奖一次;指导本科生完成的云计算和大数据类作品,参加科技创新竞赛,共获得全国特等奖一次,一等奖两次;通过“艾叔编程”公众号,以及在网易云课堂上开设的一系列免费视频课程,至今已帮助8万多名学习者入门编程,并获得好评。

    精彩内容

    目录
    前言
    第1章 Spark与大数据1
    1.1 大数据开发基础1
    1.1.1 什么是大数据1
    1.1.2 大数据开发的通用步骤2
    1.1.3 大数据开发技术4
    1.2 初识Spark10
    1.2.1 Spark是什么10
    1.2.2 Spark的技术特点11
    1.3 Spark技术栈12
    1.4 Spark重要组件13
    1.4.1 Spark Core13
    1.4.2 Spark SQL14
    1.4.3 GraphX15
    1.4.4 流数据处理16
    1.4.5 SparkR17
    1.4.6 MLlib/ML18
    1.4.7 Spark交互工具18
    1.5 Spark和Scala19
    1.5.1 Scala语言简介19
    1.5.2 为什么用Scala开发Spark框架20
    1.5.3 为什么用Scala开发Spark程序20
    1.5.4 Scala开发Spark程序所涉及的技术20
    1.5.5 Scala语言基础21
    1.6 如何快速掌握Spark21
    1.6.1 Spark学习的痛点21
    1.6.2 Spark快速学习路线图22
    1.6.3 Spark学习中的关键点23
    1.6.4 利用本书相关资源高效学习Spark23
    1.6.5 本书所使用的软件和版本25
    1.7 练习25
    第2章 构建Spark运行环境26
    2.1 Spark程序运行时架构26
    2.2 构建Spark大数据运行环境28
    2.2.1 构建HDFS28
    2.2.2 构建Yarn30
    2.2.3 构建Spark集群31
    2.3 运行Spark程序(Local方式)31
    2.4 运行Spark程序(分布式方式)32
    2.4.1 Spark on Yarn32
    2.4.2 Spark on Standalone36
    2.5 Spark程序在spark-shell上运行41
    2.6 使用Web UI监控Spark程序运行43
    2.7 扩展集群节点48
    2.8 练习49
    第3章 开发一个Spark程序51
    3.1 在命令行模式下开发Spark程序51
    3.1.1 构建Scala程序编译环境51
    3.1.2 使用Vim编写Spark程序53
    3.1.3 使用命令编译、打包Spark程序54
    3.1.4 运行Spark程序56
    3.1.5 使用java命令运行Spark程序57
    3.1.6 Spark程序编译、运行、部署的关键点58
    3.2 使用IDEA开发Spark程序58
    3.2.1 IDEA安装和基本使用59
    3.2.2 使用IDEA编辑Spark代码60
    3.2.3 IDEA编译、打包62
    3.2.4 IDEA远程提交Spark程序63
    3.3 练习64
    第4章 深入理解Spark程序代码66
    4.1 Spark程序代码结构66
    4.2 Spark程序代码的核心概念68
    4.2.1 RDD68
    4.2.2 Application68
    4.2.3 Job69
    4.2.4 DAG70
    4.2.5 Stage72
    4.2.6 Task76
    4.2.7 Application、Job、Stage和Task的并行粒度和并行条件77
    4.3 Spark程序代码执行过程77
    4.4 练习85
    第5章 RDD编程86
    5.1 RDD核心概念86
    5.1.1 Transformation的基本概念87
    5.1.2 Action的基本概念88
    5.1.3 Partition的基本概念88
    5.2 创建RDD89
    5.2.1 使用parallelize/makeRDD创建RDD89
    5.2.2 使用textFile创建RDD91
    5.2.3 其他RDD创建操作92
    5.3 RDD Partition93
    5.3.1 Partition的基本操作94
    5.3.2 Partition的分区过程96
    5.3.3 Partition和Task98
    5.3.4 计算Partition的个数100
    5.3.5 Partition的综合应用103
    5.4 Transformation操作107
    5.4.1 map操作107
    5.4.2 flatMap操作111
    5.4.3 mapPartitions操作113
    5.4.4 join操作115
    5.4.5 union操作120
    5.4.6 intersection操作121
    5.4.7 groupBy操作123
    5.4.8 groupByKey操作124
    5.4.9 reduceByKey操作125
    5.4.10 aggregateByKey操作127
    5.4.11 cogroup操作129
    5.5 Action操作130
    5.5.1 collect操作130
    5.5.2 reduce操作130
    5.5.3 fold操作131
    5.5.4 aggregate操作133
    5.5.5 foreachPartition操作134
    5.5.6 saveAsTextFile操作135
    5.5.7 saveAsObjectFile操作135
    5.6 RDD的cache/persist和checkpoint操作136
    5.6.1 cache/persist和checkpoint概述136
    5.6.2 cache/persist使用注意事项137
    5.6.3 cache/persist操作138
    5.6.4 checkpoint操作139
    5.7 练习140
    第6章 Spark SQL结构化数据处理142
    6.1 Spark SQL的核心概念142
    6.1.1 结构化数据和非结构化数据142
    6.1.2 DataFrame143
    6.1.3 Dataset144
    6.1.4 Persistent Table和Data Warehouse145
    6.1.5 SQL146
    6.1.6 SparkSession147
    6.2 Spark SQL数据处理概述147
    6.2.1 Spark SQL数据处理环境147
    6.2.2 Spark SQL处理结构化数据149
    6.2.3 Spark SQL处理不同数据源的数据150
    6.3 构建Spark SQL运行环境150
    6.3.1 Spark SQL运行环境概述150
    6.3.2 构建最简的Spark SQL运行环境151
    6.3.3 构建兼容Hive的Spark SQL运行环境153
    6.4 DataFrame/Dataset快速上手157
    6.4.1 DataFrame/Dataset使用概述157
    6.4.2 在spark-shell中使用DataFrame/Dataset157
    6.4.3 在代码中使用DataFrame/Dataset161
    6.4.4 DataFrame/Dataset使用上的区别163
    6.4.5 DataFrame行解析方法164
    6.4.6 DataFrame和Dataset转换164
    6.5 DataFrame/Dataset与数据源的转换165
    6.5.1 DataFrame/Dataset与数据源的转换关系和方法概述165
    6.5.2 DataFrame/Dataset与Seq的转换167
    6.5.3 DataFrame/Dataset与RDD的转换169
    6.5.4 DataFrame/Dataset文件与Sequence文件的转换170
    6.5.5 DataFrame/Dataset与CSV文件的转换170
    6.5.6 DataFrame/Dataset与JSON文件的转换176
    6.5.7 DataFrame/Dataset与ORC文件的转换178
    6.5.8 DataFrame/Dataset与Parquet文件的转换179
    6.5.9 DataFrame/Dataset与Avro文件的转换182
    6.5.10 DataFrame/Dataset与MySQL数据库的转换183
    6.5.11 DataFrame/Dataset与Hive表的转换188
    6.5.12 DataFrame/Dataset与Built-in data source表的转换193
    6.6 DataFrame/Dataset常用API198
    6.6.1 Action198
    6.6.2 Basic Dataset function200
    6.6.3 Typed Transformation205
    6.6.4 Untyped Transformation213
    6.7 SQL操作223
    6.7.1 常用DDL使用说明及示例224
    6.7.2 DQL使用说明及示例226
    6.7.3 常用DML使用说明及示例232
    6.8 练习234
    第7章 Spark Streaming236
    7.1 Spark Streaming基础236
    7.1.1 流数据定义及其特点236
    7.1.2 Spark Streaming的工作流程237
    7.1.3 Spark Streaming的核心概念238
    7.2 编写一个Spark Streaming程序241
    7.3 Spark Streaming Web UI的使用244
    7.3.1 Spark Streaming Web UI使用前准备244
    7.3.2 Spark Streaming Web UI参数说明247
    7.4 多路流数据合并处理示例250
    7.4.1 示例实现说明250
    7.4.2 示例分析:多数据流中Batch Job的执行254
    7.5 DStream Transformation操作255
    7.5.1 DStream Transformation实现原理256
    7.5.2 DStream常见的Transformation操作及说明258
    7.5.3 Spark Streaming的窗口(Window)操作及示例259
    7.6 DStream Output 操作262
    7.7 练习264
    第8章 Structured Streaming265
    8.1 Structured Streaming基础265
    8.1.1 Structured Streaming处理流程265
    8.1.2 Structured Streaming基本概念266
    8.1.3 Structured Streaming技术特性268
    8.2 Structured Streaming接入Text File数据源268
    8.3 Structured Streaming接入Rate数据源273
    8.4 使用Schema解析JSON格式数据源274
    8.5 使用DataFrame/Dataset处理流数据277
    8.6 Structured Streaming Window操作282
    8.7 Structured Streaming Watermarking操作288
    8.8 Structured Streaming JOIN操作290
    8.8.1 Streaming数据与Static数据的JOIN操作示例291
    8.8.2 Streaming数据与Streaming数据的JOIN操作示例295
    8.9 练习304
    第9章 SparkR305
    9.1 SparkR基础305
    9.1.1 为什么需要SparkR305
    9.1.2 什么是SparkR306
    9.1.3 SparkR和R的关系306
    9.1.4 SparkR的技术特征306
    9.1.5 SparkR程序运行时架构306
    9.2 构建SparkR程序开发和运行环境307
    9.3 SparkR代码的执行方式308
    9.3.1 在RStudio-server上执行SparkR代码309
    9.3.2 在R Shell上执行SparkR代码311
    9.3.3 使用spark-submit执行SparkR代码312
    9.3.4 在sparkR上执行SparkR代码313
    9.4 SparkR的基本使用314
    9.4.1 SparkR编程的基本流程315
    9.4.2 创建SparkDataFrame315
    9.4.3 SparkDataFrame的基本操作318
    9.4.4 在Spark上分布式执行R函数319
    9.4.5 SQL查询323
    9.5 SparkR机器学习算子323
    9.5.1 SparkR常用的机器学习算子323
    9.5.2 SparkR机器学习算子的使用324
    9.6 利用SparkR实现单词统计和图形输出326
    9.7 练习329
    第10章 GraphX330
    10.1 GraphX基础330
    10.1.1 图的定义和传统表示方法330
    10.1.2 图计算332
    10.1.3 有向多重图332
    10.1.4 GraphX特性333
    10.1.5 GraphX框架334
    10.2 GraphX的基本数据结构335
    10.2.1 VertexRDD335
    10.2.2 EdgeRDD338
    10.2.3 Graph340
    10.3 GraphX实现最短路径算法——SGDSP354
    10.4 GraphX Pregel的原理及使用361
    10.4.1 GraphX Pregel接口说明361
    10.4.2 GraphX Pregel的处理流程362
    10.4.3 GraphX Pregel的使用363
    10.5 GraphX Pregel实现最短路径算法——SGPSP366
    10.6 练习370
    参考文献372

    售后保障

    最近浏览

    猜你喜欢

    该商品在当前城市正在进行 促销

    注:参加抢购将不再享受其他优惠活动

    x
    您已成功将商品加入收藏夹

    查看我的收藏夹

    确定

    非常抱歉,您前期未参加预订活动,
    无法支付尾款哦!

    关闭

    抱歉,您暂无任性付资格

    此时为正式期SUPER会员专享抢购期,普通会员暂不可抢购