返回首页
苏宁会员
购物车 0
易付宝
手机苏宁

服务体验

店铺评分与同行业相比

用户评价:----

物流时效:----

售后服务:----

  • 服务承诺: 正品保障
  • 公司名称:
  • 所 在 地:
本店所有商品

  • 醉染图书Hadoop & Spark大数据开发实战9787517056430
  • 正版全新
    • 作者: 肖睿,雷刚跃 主编著 | 肖睿,雷刚跃 主编编 | 肖睿,雷刚跃 主编译 | 肖睿,雷刚跃 主编绘
    • 出版社: 中国水利水电出版社
    • 出版时间:2017-07-01
    送至
  • 由""直接销售和发货,并提供售后服务
  • 加入购物车 购买电子书
    服务

    看了又看

    商品预定流程:

    查看大图
    /
    ×

    苏宁商家

    商家:
    醉染图书旗舰店
    联系:
    • 商品

    • 服务

    • 物流

    搜索店内商品

    商品分类

    新春将至,本公司假期时间为:2025年1月23日至2025年2月7日。2月8日订单陆续发货,期间带来不便,敬请谅解!

    商品参数
    • 作者: 肖睿,雷刚跃 主编著| 肖睿,雷刚跃 主编编| 肖睿,雷刚跃 主编译| 肖睿,雷刚跃 主编绘
    • 出版社:中国水利水电出版社
    • 出版时间:2017-07-01
    • 版次:1
    • 印次:1
    • 字数:416000
    • 页数:298
    • 开本:16开
    • ISBN:9787517056430
    • 版权提供:中国水利水电出版社
    • 作者:肖睿,雷刚跃 主编
    • 著:肖睿,雷刚跃 主编
    • 装帧:平装
    • 印次:1
    • 定价:58.00
    • ISBN:9787517056430
    • 出版社:中国水利水电出版社
    • 开本:16开
    • 印刷时间:暂无
    • 语种:暂无
    • 出版时间:2017-07-01
    • 页数:298
    • 外部编号:1201581134
    • 版次:1
    • 成品尺寸:暂无

    前言
    关于引用作品版权说明
    章初识Hadoop
    本章任务
    任务1大数据概述
    1.1.1大数据基本概念
    1.1.2大数据对于企业带来的挑战
    任务2Hadoop概述
    1.2.1Hadoop简介
    1.2.2Hadoop生态系统
    1..大数据应用案例
    任务3Hadoop环境搭建
    1.3.1虚拟机安装
    1.3.2Linux系统安装
    1.3.3Hadoop伪分布式环境搭建
    本章总结
    本章作业
    第2章分布式文件系统HDFS
    本章任务
    任务1初识HDFS
    2.1.1HDFS概述
    2.1.2HDFS基本概念
    2.1.3HDFS体系结构
    任务2HDFS作2.2.1HDFS shell访问
    2.2.2Java API访问
    任务3HDFS运行机制
    ..1HDFS文件读写流程
    ..2HDFS副本机制
    ..数据负载均衡
    ..4机架感知
    任务4HDFS进阶
    2.4.1Hadoop序列化
    2.4.2基于文件的数据结构SequenceFile
    2.4.3基于文件的数据结构MapFile
    本章总结
    本章作业
    第3章分布式计算框架
    MapReduce
    本章任务
    任务1MapReduce编程模型
    3.1.1MapReduce概述
    3.1.2MapReduce编程模型
    3.1.3MapReduce WordCount编程实例
    任务2MapReduce进阶
    3.2.1MapReduce类型
    3.2.2MapReduce输入格式
    3..MapReduce输出格式
    3.2.4Combiner
    3.2.5Partitioner
    3.2.6RecordReader
    任务3MapReduce不错编程
    3.3.1Join的MapReduce实现
    3.3.2排序的MapReduce实现
    3.3.3二次排序的MapReduce实现
    3.3.4合并小文件的MapReduce实现
    本章总结
    本章作业
    第4章YARN与Hadoop新特
    本章任务
    任务1初识资源调度框架YARN
    4.1.1YARN产生背景
    4.1.2初识YARN
    4.1.3YARN运行机制
    任务2HDFS新特
    4.2.1HDFS NameNode HA
    4.2.2HDFS NameNode Federation
    4..HDFS SnapShots
    4.2.4WebHDFS RESTAPI
    4.2.5DistCp
    任务3YARN新特
    4.3.1ResaurceManager Restart
    4.3.2ResaurcaManager HA
    本章总结
    本章作业
    第5章大数据数据仓库Hive
    本章任务
    任务1初识Hive
    5.1.1Hive简介
    5.1.2Hive架构
    5.1.3Hive与Hadoop的关系
    5.1.4Hive与传统关系型数据库对比
    5.1.5Hive数据存储
    5.1.6Hive环境部署
    任务2Hive基本作5.2.1DDL作5.2.2DML作5..Hive shell作任务3Hive进阶
    5.3.1Hive函数
    5.3.2Hive常用调优策略
    本章总结
    本章作业
    第6章离线处理辅系统
    本章任务
    任务1使用Sqoop完成数据迁移
    6.1.1Sqoop简介
    6.1.2导入MySL数据到HDFS
    6.1.3导出HDFS数据到MySL
    6.1.4导入MySL数据到Hive
    6.1.5Sqoop中Job的使用
    任务2工作流调度框架Azkaban
    6.2.1Azkaban简介
    6.2.2Azkaban部署
    6..Azkaban实战
    本章总结
    本章作业
    第7章Spark入门
    本章任务
    任务1初识Spark
    7.1.1Spark概述
    7.1.2Spark优点
    7.1.3Spark生态系统BDAS
    任务2Scala入门
    7.2.1Scala介绍
    7.2.2Scala函数
    7..Scala面向对象
    7.2.4Scala集台
    7.2.5Scala进阶
    任务3获取Spark源码并进行编译
    7.3.1获取Spark源码
    7.3.2Spark源码编译
    任务4次与Spark亲密接触
    7.4.1Spark环境部署
    7.4.2Spark完成词频统计分析
    本章总结
    本章作业
    第8章SparkCore
    本章任务
    任务1Spark的基石RDD
    8.1.1RDD概述
    8.1.2RDD常用创建方式
    8.1.3RDD的转换
    8.1.4RDD的动作
    8.1.5RDD的依赖
    任务2RDD进阶
    8.2.1RDD缓存
    8.2.2共享变量(Shared Variables)
    8..Spark核心概念
    8.2.4Spark运行架构
    任务3基于RDD的Spark编程
    8.3.1开发前置准备
    8.3.2使用Spark Cora开发词频WordCount
    8.3.3使用Spark Core进行年龄统计
    本章总结
    本章作业
    第9章SparkSL
    本章任务
    任务1Spark SL前世今生
    9.1.1为什么需要SL
    9.1.2常用的SL on Hadoop框架
    9.1.3Spark SL概述
    任务2Spark SL编程
    9.2.1Spark SL编程入口
    9.2.2DataFrame是什么
    9..DataFrame编程
    任务3Spark SL进阶
    9.3.1Spark SL外部数据源作9.3.2Spark SL函数的使用
    9.3.3Spark SL常用调优
    本章总结
    本章作业
    0章Spark Streaming
    本章任务
    任务1初始流处理框架及Spark Streaming
    10.1.1流处理框架概述
    10.1.2Spark Streaming概述
    任务2Spark Streaming编程
    10.2.1Spark Streaming核心概念
    10.2.2使用Spark Streaming编程
    任务3Spark Streaming进阶
    10.3.1Spark Streaming整合Flume
    10.3.2Spark Streaming整合Kafka
    10.3.3Spark Streaming常用优化策略
    本章总结
    本章作业

    肖睿,北京大学教育学博士,课工场创始人,总经理。长期服务于中国IT职业教育领军企业北大青鸟Aptech,现任北大青鸟Aptech副总裁,职业教育研究院院长。肖睿先生曾就读于吉林大学少年班,专攻人工智能专家系统方向,作为靠前很好软件技术专家,早期曾领导北大方正核心软件产品研发,并受聘为北京大学软件学院特约讲师、北京创客总部创业导师、专业和课程评审专家、人力资源和社会保障部岗位标准评审专家。拥有20年IT职业教育产品管理和企业管理经验,是中国IT职业教育领军人物。

    售后保障

    最近浏览

    猜你喜欢

    该商品在当前城市正在进行 促销

    注:参加抢购将不再享受其他优惠活动

    x
    您已成功将商品加入收藏夹

    查看我的收藏夹

    确定

    非常抱歉,您前期未参加预订活动,
    无法支付尾款哦!

    关闭

    抱歉,您暂无任性付资格

    此时为正式期SUPER会员专享抢购期,普通会员暂不可抢购