加载中...
扫一扫
下载苏宁易购APP
关注苏宁推客公众号
自购省钱·分享赚钱
下载苏宁金融APP
关注苏宁易购服务号
用户评价:----
物流时效:----
售后服务:----
实名认证领苏宁支付券立即领取 >
¥
提前抢
SUPER会员专享
由于此商品库存有限,请在下单后15分钟之内支付完成,手慢无哦!
欢迎光临本店铺
点我可查看更多商品哦~
100%刮中券,最高50元无敌券,券有效期7天
亲,今日还有0次刮奖机会
我的云钻:0
您的云钻暂时不足,攒足云钻再来刮
恭喜获得1张券!
今天的机会已经全部用完了,请明天再来
恭喜刮出两张券,请选择一张领取
活动自2017年6月2日上线,敬请关注云钻刮券活动规则更新。
如活动受政府机关指令需要停止举办的,或活动遭受严重网络攻击需暂停举办的,或者系统故障导致的其它意外问题,苏宁无需为此承担赔偿或者进行补偿。
全新Python大数据处理库PySpark实战汪明9787302575085
¥ ×1
商品
服务
物流
章 大数据时代 11.1 什么是大数据 11.1.1 大数据的特点 21.1.2 大数据的发展趋势 31.2 大数据下的分析工具 41.2.1 Hadoop 51.2.2 Hive 61.. HBase 61.2.4 Apache Phoenix 71.2.5 Apache Drill 71.2.6 Apache Hudi 71.2.7 Apache Kylin 81.2.8 Apache Presto 81.2.9 ClickHouse 81.2.10 Apache Spark 91.2.11 Apache Flink 101.2.12 Apache Storm 101.2.13 Apache Druid 101.2.14 Apache Kafka 111.2.15 TensorFlw 11.2.16 PyTorch 121.2.17 Apache Superset 121.2.18 Elasticsearch 121.2.19 Jupyter Notebook 131.2.20 Apache Zeppelin 131.3 小结 14第2章 大数据的瑞士——Spark 152.1 Hadoop与生态系统 152.1.1 Hadoop概述 152.1.2 HDFS体系结构 192.1.3 Hadoop生态系统 202.2 Spark与Hadoop 2.2.1 Apache Spark概述 2.2.2 Spark和Hadoop比较 24. Spark核心概念 25..1 Spark软件栈 25..2 Spark运行架构 26.. Spark部署模式 272.4 Spark基本操作 292.5 SL in Spark 332.6 Spark与机器学习 332.6.1 决策树算法 352.6.2 贝叶斯算法 362.6.3 支持向量机算法 362.6.4 随机森林算法 372.6.5 人工神经网络算法 382.6.6 关联规则算法 392.6.7 线回归算法 402.6.8 KNN算法 402.6.9 K-Means算法 412.7 小结 42第3章 Spark实战环境设定 433.1 建立Spark环境前提 433.1.1 CentOS 7安装 453.1.2 FinalShell安装 553.1.3 PuTTY安装 583.1.4 JDK安装 603.1.5 Python安装 633.1.6 Visual Studio Code安装 643.1.7 PyCharm安装 653.2 一分钟建立Spark环境 663.2.1 Linux搭建Spark环境 663.2.2 Windows搭建Spark环境 693.3 建立Hadoop集群 793.3.1 CentOS配置 793.3.2 Hadoop伪分布模式安装 813.3.3 Hadoop完全分布模式安装 873.4 安装与配置Spark集群 933.5 安装与配置Hive 993.5.1 Hive安装 993.5.2 Hive与Spark集成 1083.6 打造交互式Spark环境 1103.6.1 Spark Shell 1113.6.2 PySpark 1123.6.3 Jupyter Notebook安装 1123.7 小结 118第4章 活用PySpark 1194.1 Python 语法复习 1194.1.1 Python基础语法 1204.1.2 Python变量类型 1244.1.3 Python运算符 1354.1.4 Python控制语句 1394.1.5 Python函数 1434.1.6 Python模块和包 1494.1.7 Python面向对象 1544.1.8 Python异常处理 1574.1.9 Python JSON处理 1594.1.10 Python日期处理 1604.2 用PySpark建立个Spark RDD 1614.2.1 PySpark Shell 建立RDD 1634.2.2 VSCode编程建立RDD 1654.. Jupyter 编程建立RDD 1674.3 RDD的操作与观察 1684.3.1 first操作 1694.3.2 max操作 1694.3.3 sum操作 1704.3.4 take操作 1714.3.5 top操作 1724.3.6 count操作 1724.3.7 collect操作 1734.3.8 collectAsMap操作 1744.3.9 countByKey操作 1754.3.10 countByValue操作 1754.3.11 glom操作 1764.3.12 coalesce操作 1774.3.13 combineByKey操作 1784.3.14 distinct操作 1794.3.15 filter操作 1804.3.16 flatMap操作 1814.3.17 flatMapValues操作 1814.3.18 fold操作 1824.3.19 foldByKey操作 1834.3.20 foreach操作 1844.3.21 foreachPartition操作 1854.3.22 map操作 1864.3. mapPartitions操作 1874.3.24 mapPartitionsWithIndex操作 1874.3.25 mapValues操作 1884.3.26 groupBy操作 1894.3.27 groupByKey操作 1904.3.28 keyBy操作 1914.3.29 keys操作 1924.3.30 zip操作 1934.3.31 zipWithIndex操作 1944.3.32 values操作 1944.3.33 union操作 1954.3.34 takeOrdered操作 1964.3.35 takeSample操作 1974.3.36 subtract操作 1984.3.37 subtractByKey操作 1984.3.38 stats操作 1994.3.39 sortBy操作 2004.3.40 sortByKey操作 2014.3.41 sample操作 2024.3.42 repartition操作 2034.3.43 reduce操作 2044.3.44 reduceByKey操作 2054.3.45 randomSplit操作 2064.3.46 lookup操作 2074.3.47 join操作 2084.3.48 intersection操作 2094.3.49 fullOuterJoin操作 2104.3.50 leftOuterJoin与rightOuterJoin操作 2114.3.51 aggregate操作 2124.3.52 aggregateByKey操作 2154.3.53 cartesian操作 2174.3.54 cache操作 2184.3.55 saveAsTextFile操作 2184.4 共享变数 2204.4.1 广播变量 2204.4.2 累加器 2214.5 DataFrames与Spark SL 24.5.1 DataFrame建立 24.5.2 Spark SL基本用法 2284.5.3 DataFrame基本操作 14.6 撰写个Spark程序 2454.7 提交你的 Spark 程序 2464.8 小结 248第5章 PySpark ETL 实战 2495.1 认识资料单元格式 2495.2 观察资料 2555.3 选择、筛选与聚合 2675.4 存储数据 2695.5 Spark存储数据到SL Server 2725.6 小结 275第6章 PySpark分布式机器学习 2766.1 认识数据格式 2776.2 描述统计 2806.3 资料清理与变形 2846.4 认识Pipeline 2886.5 逻辑回归原理与应用 2906.5.1 逻辑回归基本原理 2906.5.2 逻辑回归应用示例:Titanic幸存者预测 2916.6 决策树原理与应用 2956.6.1 决策树基本原理 2956.6.2 决策树应用示例:Titanic幸存者预测 2966.7 小结 299第7章 实战:PySpark Kafka实时项目 3017.1 Kafka和Flask环境搭建 3017.2 代码实现 3037.3 小结 310
汪明,硕士,于中国矿业大学,徐州软件协会副理事长,某创业公司合伙人。从事软件行业十余年,发表数十篇。著有图书《TypeScript实战》《Go并发编程实战》。
PySpark可以对大数据进行分布式处理,降低了大数据的学习门槛。本书是一本PySpark入门教材,重点讲述PySpark安装、PySpark用法、ETL数据处理、PySpark机器学习及其实战,很后给出一个综合实战案例。本书逻辑线索清晰,内容体系合理,适合有一定Python基础的大数据分析和处理人员学习使用。
抢购价:¥ 38.00
易购价:¥ 38.00
注:参加抢购将不再享受其他优惠活动
亲,很抱歉,您购买的宝贝销售异常火爆,让小苏措手不及,请稍后再试~
验证码错误
看不清楚?换一张
确定关闭
亲,大宗购物请点击企业用户渠道>小苏的服务会更贴心!
亲,很抱歉,您购买的宝贝销售异常火爆让小苏措手不及,请稍后再试~
查看我的收藏夹
非常抱歉,您前期未参加预订活动,无法支付尾款哦!
关闭
抱歉,您暂无任性付资格
继续等待
0小时0分
立即开通
SUPER会员