文轩网图书旗舰店
  • 扫码下单

  • Spark Cookbook中文版 (印)亚达夫(Rishi Yadav) 著;顾星竹,刘见康 译 专业科技 文轩网
  • 新华书店正版
    • 作者: (印)亚达夫(Rishi Yadav) 著;顾星竹,刘见康 译著
    • 出版社: 人民邮电出版社
    • 出版时间:2016-10-01 00:00:00
    送至
  • 由""直接销售和发货,并提供售后服务
  • 加入购物车 购买电子书
    服务

    看了又看

    商品预定流程:

    查看大图
    /
    ×

    店铺装修中

    商家:
    文轩网图书旗舰店
    联系:
    • 商品

    • 服务

    • 物流

    搜索店内商品

    文轩网图书旗舰店

  •      https://product.suning.com/0070067633/11555288247.html

     

    商品参数
    • 作者: (印)亚达夫(Rishi Yadav) 著;顾星竹,刘见康 译著
    • 出版社:人民邮电出版社
    • 出版时间:2016-10-01 00:00:00
    • 版次:1
    • 印次:1
    • 印刷时间:2016-10-01
    • 字数:251千字
    • 页数:190
    • 开本:16开
    • 装帧:平装
    • ISBN:9787115429667
    • 国别/地区:中国
    • 版权提供:人民邮电出版社

    Spark Cookbook中文版

    作  者:(印)亚达夫(Rishi Yadav) 著;顾星竹,刘见康 译
    定  价:45
    出 版 社:人民邮电出版社
    出版日期:2016年10月01日
    页  数:190
    装  帧:平装
    ISBN:9787115429667
    主编推荐

    内容简介

    Spark是一个基于内存计算的开源集群计算系统,它很好小巧玲珑,让数据分析更加快速,已逐渐成为新一代大数据处理平台中的佼佼者。
    本书内容分为12章,从认识Apache Spark开始讲解,陆续介绍了Spark的使用、外部数据源、Spark SQL、Spark Streaming、机器学习、监督学习中的回归和分类、无监督学习、推荐系统、图像处理、优化及调优等内容。
    本书适合大数据领域的技术人员,可以帮助他们更好地洞悉大数据,本书也适合想要学习Spark进行大数据处理的人员,它将是一本不错的参考教程。

    作者简介

    亚达夫,拥有17年设计和开发企业级应用的经验。他是一位开源软件专家,引领了美国公司的大数据趋势。Rish被评为2014年40位40岁以下硅谷杰出工程师之一。他于1998年获得杰出的印度理工学院(Indian Institute of Technology,IIT)德里分校的学士学位。大约在10年前,Rishi创办了InfoObjects,这是一家以深度探索数据为宗旨的企业。该公司已连续4年被列入发展快公司5000强。InfoObjects也被授予了2014及2015年度湾区杰出工作地点首名的桂冠。Rishi还是一位开源社区贡献者和活跃的博主。

    精彩内容

    目录
    第1章开始使用Apache Spark 1
    1.1简介1
    1.2使用二进制文件安装Spark2
    1.3通过Maven构建Spark源码5
    1.4在Amazon EC2上部署Spark7
    1.5在集群上以独立模式部署
    Spark13
    1.6在集群上使用Mesos部署Spark18
    1.7在集群上使用YARN部署19
    1.8使用Tachyon作为堆外存储层22
    第2章使用Spark开发应用27
    2.1简介27
    2.2探索Spark shell27
    2.3在Eclipse中使用Maven开发Spark应用29
    2.4在Eclipse中使用SBT开发Spark应用33
    2.5在Intellij IDEA中使用Maven开发Spark应用34
    2.6在Intellij IDEA中使用SBT开发Spark应用36
    第3章外部数据源38
    3.1简介38
    3.2从本地文件系统加载数据39
    3.3从HDFS加载数据40
    3.4从HDFS加载自定义输入格式的数据45
    3.5从Amazon S3加载数据46
    3.6从Apache Cassandra加载数据49
    3.7从关系型数据库加载数据54
    第4章Spark SQL57
    4.1简介57
    4.2理解Catalyst优化器60
    4.3创建HiveContext63
    4.4使用case类生成数据格式66
    4.5编程指定数据格式67
    4.6使用Parquet格式载入及存储数据69
    4.7使用JSON格式载入及存储数据73
    4.8从关系型数据库载入及存储数据75
    4.9从任意数据源载入及存储数据78
    第5章Spark Streaming80
    5.1简介80
    5.2使用Streaming统计字数82
    5.3Twitter流数据处理84
    5.4Kafka流数据处理88
    第6章机器学习——MLlib94
    6.1简介94
    6.2创建向量95
    6.3创建向量标签97
    6.4创建矩阵99
    6.5计算概述统计量101
    6.6计算相关性102
    6.7进行假设检验104
    6.8使用ML创建机器学习
    流水线106
    第7章监督学习之回归——MLlib109
    7.1简介109
    7.2使用线性回归110
    7.3理解代价函数112
    7.4使用Lasso线性回归116
    7.5使用岭回归117
    第8章监督学习之分类——MLlib119
    8.1简介119
    8.2逻辑回归分类119
    8.3支持向量机二元分类124
    8.4决策树分类127
    8.5随机森林分类134
    8.6梯度提升树(GBTs)分类139
    8.7朴素贝叶斯分类140
    第9章无监督学习——MLlib143
    9.1简介143
    9.2使用k-means聚类144
    9.3主成分分析的降维149
    9.4奇异值分解降维155
    第10章推荐系统159
    10.1简介159
    10.2显性反馈的协同过滤161
    10.3隐性反馈的协同过滤164
    第11章图像处理——GraphX169
    11.1简介169
    11.2基本图像运算170
    11.3使用PageRank171
    11.4查找连通分量174
    11.5相邻聚合实现177
    第12章优化及调优180
    12.1简介180
    12.2内存优化183
    12.3使用压缩提升性能185
    12.4使用序列化提升性能186
    12.5优化垃圾回收187
    12.6优化并行度的级别187
    12.7理解未来的优化——Tungsten项目188

    售后保障

    最近浏览

    猜你喜欢

    该商品在当前城市正在进行 促销

    注:参加抢购将不再享受其他优惠活动

    x
    您已成功将商品加入收藏夹

    查看我的收藏夹

    确定

    非常抱歉,您前期未参加预订活动,
    无法支付尾款哦!

    关闭

    抱歉,您暂无任性付资格

    此时为正式期SUPER会员专享抢购期,普通会员暂不可抢购