加载中...
扫一扫
下载苏宁易购APP
关注苏宁推客公众号
自购省钱·分享赚钱
下载苏宁金融APP
关注苏宁易购服务号
用户评价:----
物流时效:----
售后服务:----
实名认证领苏宁支付券立即领取 >
¥
提前抢
SUPER会员专享
由于此商品库存有限,请在下单后15分钟之内支付完成,手慢无哦!
欢迎光临本店铺
点我可查看更多商品哦~
100%刮中券,最高50元无敌券,券有效期7天
亲,今日还有0次刮奖机会
我的云钻:0
您的云钻暂时不足,攒足云钻再来刮
恭喜获得1张券!
今天的机会已经全部用完了,请明天再来
恭喜刮出两张券,请选择一张领取
活动自2017年6月2日上线,敬请关注云钻刮券活动规则更新。
如活动受政府机关指令需要停止举办的,或活动遭受严重网络攻击需暂停举办的,或者系统故障导致的其它意外问题,苏宁无需为此承担赔偿或者进行补偿。
全新Python数据科学应用从入门到精通张甜、杨维忠9787302646853
¥ ×1
商品
服务
物流
章 数据科学应用概述 11.1 什么是数据清洗、特征工程、数据可视化、数据挖掘与建模 11.1.1 数据清洗的概念 11.1.2 特征工程的概念 21.1.3 数据可视化的概念 41.1.4 数据挖掘与建模的概念 41.2 为什么要开展数据清洗、特征工程、数据可视化和数据挖掘与建模 41.2.1 数据清洗、特征工程的重要 41.2.2 数据可视化的重要 51.. 数据挖掘与建模的重要 51.3 为什么要将Python作为实现工具 61.4 数据清洗、特征工程、数据可视化和数据挖掘与建模的主要内容 61.4.1 数据清洗的主要内容 61.4.2 特征工程的主要内容 71.4.3 数据可视化的主要内容 71.4.4 数据挖掘与建模的主要内容 81.5 数据清洗、特征工程、数据可视化和数据挖掘与建模的应用场景 81.5.1 数据清洗、特征工程的应用场景 81.5.2 数据可视化的应用场景 91.5.3 数据挖掘与建模的应用场景 101.6 数据清洗、特征工程和数据可视化的注意事项 141.6.1 数据清洗、特征工程的注意事项 141.6.2 数据可视化的注意事项 141.7 数据挖掘与建模的注意事项 151.8 习题 19第2章 Python入门基础 212.1 Python概述 212.2 Anaconda平台的下载与安装 222.2.1 Anaconda平台的下载 222.2.2 Anaconda平台的安装 242.. Anaconda Prompt (Anaconda3) 262.2.4 Spyder (Anaconda3)的介绍及偏好设置 262.2.5 Spyder (Anaconda3)窗口介绍 29. Python的注释 342.4 基本输出函数—print()函数 352.5 基本输入函数—input()函数 362.6 Python的保留字与标识符 372.6.1 Python中的保留字 372.6.2 Python的标识符 372.7 Python的变量 382.8 Python的基本数据类型 392.9 Python的数据运算符 432.10 Python序列的概念及通用操作 452.10.1 索引 462.10.2 切片 462.10.3 相加 472.10.4 相乘 482.10.5 元素检查 482.10.6 与序列相关的内置函数 492.11 Python列表 502.11.1 列表的基本操作 502.11.2 列表元素的基本操作 522.12 Python元组 532.12.1 元组的基本操作 532.12.2 元组元素的基本操作 552.13 Python字典 552.13.1 字典的基本操作 562.13.2 字典元素的基本操作 582.14 Python集合 602.15 Python字符串 612.16 习题 65第3章 数据清洗 673.1 Python数据清洗基础 673.1.1 Python函数与模块 673.1.2 numpy模块数组 743.1.3 pandas模块序列 793.1.4 pandas模块数据框 813.1.5 Python流程控制语句 863.2 Python数据读取、合并、写入 903.2.1 读取、合并、写入文本文件(CSV或者TXT) 903.2.2 读取、合并、写入Excel数据文件 983.. 读取、合并、写入Stata数据文件 993.2.4 读取、合并SPSS数据文件 1003.3 Python数据检索 1023.4 Python数据行列处理 1033.4.1 删除变量列、样本行 1043.4.2 更改变量的列名称、调整变量列顺序 1043.4.3 改变列的数据格式 1063.4.4 多列转换 1063.4.5 数据百分比格式转换 1073.5 Python数据缺失值处理 1073.5.1 查看数据集中的缺失值 1083.5.2 填充数据集中的缺失值 1093.5.3 删除数据集中的缺失值 1133.6 Python数据重复值处理 1153.6.1 查看数据集中的重复值 1153.6.2 删除数据集中的重复值 1173.7 Python数据异常值处理 1183.7.1 运用3δ准则检测异常值 1183.7.2 绘制箱图检测异常值 1193.7.3 删除异常值 1213.7.4 3δ准则替换异常值 1223.7.5 1%/99%分位数替换异常值 13.8 Python数据透视表、描述分析和交叉表分析 1243.8.1 数据透视表 1243.8.2 描述分析 1293.8.3 交叉表分析 1323.9 习题 136第4章 特征选择 1384.1 特征选择的概念、原则及方法 1384.1.1 特征选择的概念 1384.1.2 特征选择的原则 1394.1.3 特征选择的方法 1394.2 过滤法—去掉低方差的特征 1414.3 过滤法—单变量特征选择 1444.3.1 卡方检验 1444.3.2 相关分析 1464.3.3 方差分析(F检验) 1494.3.4 互信息 1504.4 包裹法—递归特征消除 1514.5 嵌入法 1524.5.1 随机森林算法选择特征变量 1534.5.2 提升法算法选择特征变量 1554.5.3 Logistic回归算法选择特征变量 1564.5.4 线支持向量机算法选择特征变量 1584.6 习题 159第5章 特征处理 1615.1 特征归一化、特征标准化、样本归一化 1615.1.1 特征归一化 1625.1.2 特征标准化 1645.1.3 样本归一化 1655.2 特征等宽分箱和等频分箱 1685.3 特征决策树分箱 1705.3.1 信息熵 1705.3.2 信息增益 1705.3.3 增益比率 1715.3.4 基尼指数 1715.3.5 变量重要 1725.3.6 特征决策树分箱的Python实现 1725.4 特征卡方分箱 1745.5 WOE(据权重)和IV(信息价值) 1755.5.1 WOE和IV的概念 1755.5.2 WOE的作用 1765.5.3 WOE编码注意事项 1775.5.4 IV的作用 1775.5.5 为什么使用IV而不是WOE来判断特征变量的预测能力 1785.6 WOE、IV的Python实现 1795.6.1 载入分析所需要的模块和函数 1795.6.2 数据读取及观察 1795.6.3 描述统计分析 1815.6.4 特征变量筛选 1825.6.5 划分训练样本和测试样本 1835.6.6 分箱操作 1845.6.7 画分箱图 1855.6.8 调整分箱 1905.6.9 将训练样本和测试样本进行WOE编码 1925.6.10 构建Logistic模型进行预测 1935.6.11 模型预测及评价 1945.6.12 绘制ROC曲线,计算AUC值 1965.7 习题 198第 6 章 特征提取 1996.1 无监督降维技术—主成分分析 1996.1.1 主成分分析的基本原理 1996.1.2 主成分分析的数学概念 2006.1.3 主成分的特征值 2016.1.4 样本的主成分得分 2016.1.5 主成分载荷 2026.1.6 主成分分析的Python实现 2036.2 有监督降维技术—线判分析 2106.2.1 线判分析的基本原理 2106.2.2 线判分析的算法过程 2126.. 线判分析的Python实现 2126.3 习题 222第 7 章 数据可视化 2247.1 四象限图 2247.1.1 四象限图简介 2247.1.2 案例数据介绍 2257.1.3 Python代码示例 2277.2 热力图 07.2.1 热力图简介 07.2.2 案例数据介绍 17.. Python代码示例 17.3 直方图 47.3.1 直方图简介 47.3.2 案例数据介绍 7.3.3 Python代码示例 7.4 条形图、核密度图和正态图 427.4.1 条形图、核密度图和正态图简介 2427.4.2 案例数据介绍 2437.4.3 Python代码示例 2437.5 散点图 2467.5.1 散点图简介 2467.5.2 案例数据介绍 2477.5.3 Python代码示例 2497.6 线图(含时间序列趋势图) 2557.6.1 线图(含时间序列趋势图)简介 2557.6.2 案例数据介绍 2577.6.3 Python代码示例 2587.7 双纵轴线图 2607.7.1 双纵轴线图简介 2607.7.2 案例数据介绍 2607.7.3 Python代码示例 2607.8 回归拟合图 2627.8.1 回归拟合图简介 2627.8.2 案例数据介绍 2637.8.3 Python代码示例 2637.9 箱图 2657.9.1 箱图简介 2657.9.2 案例数据介绍 2677.9.3 Python代码示例 2677.10 小提琴图 2717.10.1 小提琴图简介 2717.10.2 案例数据介绍 2737.10.3 Python代码示例 2747.11 联合分布图 2767.11.1 联合分布图简介 2767.11.2 案例数据介绍 2777.11.3 Python代码示例 2777.12 雷达图 2817.12.1 雷达图简介 2817.12.2 案例数据介绍 2817.1. Python代码示例 2827.13 饼图 2877.13.1 饼图简介 2877.13.2 案例数据介绍 2887.13.3 Python代码示例 2897.14 习题 291第8章 数据挖掘与建模1——线回归 2998.1 基本思想 2998.1.1 线回归算法的概念及数学解释 2998.1.2 线回归算法的优点 3018.1.3 线回归算法的缺点 3028.2 应用案例 3028.2.1 数据挖掘与建模思路 3028.2.2 数据文件介绍 3038.. 导入分析所需要的模块和函数 3038.2.4 数据读取及观察 3048.3 使用smf进行线回归 3058.3.1 使用smf进行线回归 3068.3.2 多重共线检验 3108.3.3 解决多重共线问题 3118.3.4 绘制拟合回归平面 3128.4 使用sklearn进行线回归 3138.4.1 使用验集法进行模型拟合 3158.4.2 更换随机数种子,使用验集法进行模型拟合 3158.4.3 使用10折交叉验法进行模型拟合 3168.4.4 使用10折重复10次交叉验法进行模型拟合 3188.4.5 使用留一交叉验法进行模型拟合 3188.5 习题 319第9章 数据挖掘与建模2——Logistic回归 3209.1 基本思想 3209.1.1 Logistic回归算法的概念及数学解释 3209.1.2 “分类问题监督式学习”的能度量 3219.2 应用案例 3279.2.1 数据文件介绍 3279.2.2 导入分析所需要的模块和函数 3279.. 数据读取及观察 3289.3 描述分析 3309.4 数据处理 3329.4.1 区分分类特征和连续特征并进行处理 3329.4.2 将样本全集分割为训练样本和测试样本 3339.5 建立二元Logistic回归算法模型 3349.5.1 使用statsmodels建立二元Logistic回归算法模型 3349.5.2 使用sklearn建立二元Logistic回归算法模型 3399.5.3 特征变量重要水平分析 3429.5.4 绘制ROC曲线,计算AUC值 3459.5.5 计算科恩kappa得分 3469.6 习题 3470章 数据挖掘与建模3——决策树 34910.1 基本思想 34910.1.1 决策树算法的概念与原理 34910.1.2 决策树的剪枝 35010.1.3 包含剪枝决策树的损失函数 35110.2 数据准备 35210.2.1 案例数据说明 35210.2.2 导入分析所需要的模块和函数 35310.3 分类问题决策树算法示例 35410.3.1 变量设置及数据处理 35410.3.2 未考虑成本-复杂度剪枝的决策树分类算法模型 35510.3.3 考虑成本-复杂度剪枝的决策树分类算法模型 35810.3.4 绘制图形观察叶节点总不纯度随alpha值的变化情况 35910.3.5 绘制图形观察节点数和树的深度随alpha值的变化情况 35910.3.6 绘制图形观察训练样本和测试样本的预测准确率随alpha值的变化情况 36010.3.7 通过10折交叉验法寻求很优alpha值 36110.3.8 决策树特征变量重要水平分析 36210.3.9 绘制ROC曲线 36310.3.10 运用两个特征变量绘制决策树算法决策边界图 36310.4 回归问题决策树算法示例 36510.4.1 变量设置及数据处理 36510.4.2 未考虑成本-复杂度剪枝的决策树回归算法模型 36610.4.3 考虑成本-复杂度剪枝的决策树回归算法模型 36710.4.4 绘制图形观察叶节点总均方误差随alpha值的变化情况 36810.4.5 绘制图形观察节点数和树的深度随alpha值的变化情况 36810.4.6 绘制图形观察训练样本和测试样本的拟合优度随alpha值的变化情况 36910.4.7 通过10折交叉验法寻求很优alpha值并开展特征变量重要水平分析 37010.4.8 很优模型拟合效果图形展示 37210.4.9 构建线回归算法模型进行对比 37310.5 习题 3731章 数据挖掘与建模4——随机森林 37411.1 随机森林算法的基本原理 37411.1.1 模型融合的基本思想 37411.1.2 集成学习的概念与分类 37811.1.3 装袋法的概念与原理 37911.1.4 随机森林算法的概念与原理 38011.1.5 随机森林算法特征变量重要度量 38011.1.6 部分依赖图与个体条件期望图 38011.2 数据准备 38111.2.1 案例数据说明 38211.2.2 导入分析所需要的模块和函数 38211.3 分类问题随机森林算法示例 38211.3.1 变量设置及数据处理 38311.3.2 二元Logistic回归和单棵分类决策树算法 38311.3.3 装袋法分类算法 38411.3.4 随机森林分类算法 38511.3.5 寻求max_features很优参数 38511.3.6 寻求n_estimators很优参数 38611.3.7 随机森林特征变量重要水平分析 38811.3.8 绘制部分依赖图与个体条件期望图 38911.3.9 模型能评 39011.3.10 绘制ROC曲线 39211.3.11 运用两个特征变量绘制随机森林算法决策边界图 39211.4 回归问题随机森林算法示例 39311.4.1 变量设置及数据处理 39311.4.2 线回归、单棵回归决策树算法 39411.4.3 装袋法回归算法 39511.4.4 随机森林回归算法 39511.4.5 寻求max_features很优参数 39511.4.6 寻求n_estimators很优参数 39611.4.7 随机森林特征变量重要水平分析 39911.4.8 绘制部分依赖图与个体条件期望图 40011.4.9 很优模型拟合效果图形展示 40111.5 习题 4022章 数据挖掘与建模5——神经网络 40412.1 神经网络算法的基本原理 40412.1.1 神经网络算法的基本思想 40412.1.2 感知机 40612.1.3 多层感知机 41012.1.4 神经元激活函数 41112.1.5 误差反向传播算法(BP算法) 41612.1.6 近似定理及多隐藏层优势 42412.1.7 BP算法过拟合问题的解决 42412.2 数据准备 42612.2.1 案例数据说明 42612.2.2 导入分析所需要的模块和函数 4281. 回归神经网络算法示例 4281..1 变量设置及数据处理 4281..2 单隐藏层的多层感知机算法 4291.. 神经网络特征变量重要水平分析 4311..4 绘制部分依赖图与个体条件期望图 4321..5 拟合优度随神经元个数变化的可视化展示 4331.. 通过K折交叉验寻求单隐藏层很优神经元个数 4341.. 双隐藏层的多层感知机算法 4361.. 很优模型拟合效果图形展示 43712.4 二分类神经网络算法示例 43812.4.1 变量设置及数据处理 43812.4.2 单隐藏层二分类问题神经网络算法 43912.4.3 双隐藏层二分类问题神经网络算法 44012.4.4 早停策略减少过拟合问题 44012.4.5 正则化(权重衰减)策略减少过拟合问题 44112.4.6 模型能评 44112.4.7 绘制ROC曲线 44312.4.8 运用两个特征变量绘制二分类神经网络算法决策边界图 44312.5 习题 4443章 数据挖掘与建模6据挖掘与建分析 44613.1 RFM分析的基本原理 44613.1.1 RFM分析的基本思想 44613.1.2 RFM分类组合与客户类型对应情况 44713.1.3 不同类型客户的特点及市场营销策略 44813.2 数据准备 44913.2.1 案例数据说明 45013.2.2 导入分析所需要的模块和函数 45013.3 RFM分析示例 45013.3.1 数据读取及观察 45013.3.2 计算R、F、M分值 45313.3.3 生成RFM数据集 45513.3.4 不同类别客户数量分析 45913.3.5 不同类别客户消费金额分析 46213.4 习题 465
张甜,山东大学博士生,拥有7年商业银行工作经历和8年学术研究经历。精通Python、R、Stata、SPSS等多种统计分析软件,精通高级计量经济学、机器学习。在《财贸经济》等很好期刊发表多篇著作,著有多本书,深受读者欢迎。 杨维忠,山东大学西方经济学硕士,CPA,目前就职于某全国股份制商业银行总行,担任总行数据分析与机器学习内训师。精通Python、Stata、SPSS、Eviews、Excel等多种统计分析软件,具有深厚的学术研究功底、丰富的实践操作经历和授课经验,尤其擅长将各种统计分析方法与机器学习算法应用到工作中,著有多本数据分析教材,深受读者欢迎。
《Python数据科学应用从入门到精通》是张甜博士和数据分析领域专家杨维忠合力打造的精心之作,现在已成为编辑。本书全面介绍了Python数据分析的基本概念和技能,包括数据清洗、数据可视化、统计分析、机器学习等。重要的是,本书注重实践应用,提供了大量的实例和案例,帮读者更好地理解和掌握所学知识。无论是经济学、管理学、统计学、金融学、社会学、医学还是商务等专业学生,都可以将其作为学习Python数据分析的专业教材和参考书。而对于企业和事业单位来说,本书也是数字化人才培养的教科书和工具书。同时,职场人士也可以利用本书自学,掌握Python数据分析,提升数据挖掘、分析和可视化建模能力,从而提高工作效率和改善绩效水平。
抢购价:¥ 38.00
易购价:¥ 38.00
注:参加抢购将不再享受其他优惠活动
亲,很抱歉,您购买的宝贝销售异常火爆,让小苏措手不及,请稍后再试~
验证码错误
看不清楚?换一张
确定关闭
亲,大宗购物请点击企业用户渠道>小苏的服务会更贴心!
亲,很抱歉,您购买的宝贝销售异常火爆让小苏措手不及,请稍后再试~
查看我的收藏夹
非常抱歉,您前期未参加预订活动,无法支付尾款哦!
关闭
抱歉,您暂无任性付资格
继续等待
0小时0分
立即开通
SUPER会员