由于此商品库存有限,请在下单后15分钟之内支付完成,手慢无哦!
100%刮中券,最高50元无敌券,券有效期7天
活动自2017年6月2日上线,敬请关注云钻刮券活动规则更新。
如活动受政府机关指令需要停止举办的,或活动遭受严重网络攻击需暂停举办的,或者系统故障导致的其它意外问题,苏宁无需为此承担赔偿或者进行补偿。
音像Python数据整理/数据科学与工程技术丛书
¥ ×1
译者序
前言
章 Python数据整理入门1
1.1 引言1
1.2 Python数据整理3
1.3 列表、集合、字典、元组和字符串3
1.3.1 列表4
练习1:访问列表成员 4
练习2:生成列表5
练习3:遍历列表并检查成员7
练习4:列表排序8
练习5:生成随机列表9
活动1:处理列表10
1.3.2 集合11
1.3.3 字典13
练习6:访问和设置字典中的值13
练习7:遍历字典14
练习8:再次讨论值列表问题14
练习9:删除字典中的值15
练习10:字典推导式16
1.3.4 元组16
练习11:处理元组17
1.3.5 字符串18
练习12:访问字符串18
练习13:字符串切片19
练习14:字符串拆分与合并20
活动2:分析多行字符串并生成单词数量21
1.4 小结22
第2章 高级数据结构和文件处理
2.1 引言
2.2 高级数据结构
2.2.1 迭代器24
练习15:迭代器介绍24
2.2.2 栈25
练习16:在Python中实现栈26
练习17:使用用户定义的方法实现栈26
2.. Lambda表达式28
练习18:用Lambda表达式明三角恒等式28
练习19:用于排序的Lambda表达式29
练习20:多元素成员检查30
2.2.4 队列30
练习21:在Python中实现队列31
活动3:Permutations、迭代器、Lambda、列表32
. Python基本文件操作33
练习22:写入和读取环境变量33
练习:打开和关闭文件34
练习24:逐行读取文件36
练习25:写入文件37
活动4:设计专属CSV解析器38
2.4 小结39
第3章 NumPy、pandas和Matplotlib简介40
3.1 引言40
3.2 NumPy数组操作40
练习26:从列表中创建NumPy数组41
练习27:两个NumPy数组相加42
练习28:NumPy数组的数学运算43
练习29:NumPy数组的高级数学运算43
练习30:使用arange和linspace生成数组44
练习31:建多数组45
练习32:二维数组的维度、形状、大小和数据类型46
练习33:全零、全一、随机、单位矩阵和向量46
练习34:reshape和 ravel函数48
练习35:索引和切片49
练习36:数组操作(数组-数组、数组-标量和通用函数)52
3.3 pandas的DataFrame54
练习37:创建pandas序列55
练习38:pandas序列和数据处理56
练习39:创建pandas DataFrame57
练习40:查看部分DataFrame58
练习41:创建和删除新的列或行61
3.4 NumPy和pandas的统计与可视化63
3.4.1 基本描述统计(用于可视化的Matplotlib库)63
练习42:通过散点图介绍Matplotlib64
3.4.2 统计指标的定义—集中趋势和分布65
3.4.3 随机变量与概率分布66
3.4.4 统计和可视化中的数据整理68
3.4.5 DataFrame的基本描述统计计算68
练习43:从均匀分布生成随机数68
练习44:从二项分布和条形图生成随机数69
练习45:从正态分布和直方图生成随机数70
练习46:从DataFrame计算描述统计71
练习47:内置绘图实用工具74
活动5:从CSV文件生成统据75
3.5 小结75
第4章 深入学习Python数据整理77
4.1 引言77
4.2 选取子集、过滤和分组77
4.2.1 选取子集78
练习48:从Excel文件加载和检查超市的销售数据78
练习49:unique函数80
4.2.2 条件选择与布尔过滤81
练习50:设定和重置索引84
4.. 分组86
练习51:GroupBy方法86
4.3 处理缺失值和检测异常值89
4.3.1 pandas中的缺失值89
练习52:用fillna填充缺失值91
练习53:用dropna删除缺失值93
4.3.2 使用简单的统计测试进行异常值检测94
4.4 合并数据的方法:concat、merge和join96
练习54:concat方法96
练习55:merge方法(通过公共键)97
练习56:join方法100
4.5 pandas的实用方法102
4.5.1 随机抽样102
练习57:使用sample方法随机抽样102
4.5.2 value_counts方法103
4.5.3 数据透视表功能104
练习58:按列值排序—sort_values方法105
练习59:使用apply方法实现用户自定义函数的灵活107
活动6:成人收入数据集的使用109
4.6 小结110
第5章 适应不同类型的数据源112
5.1 引言112
5.2 从不同的基于文本的(和非文本的)源中读取数据112
5.2.1 本章提供的数据文件113
5.2.2 本章需安装的库113
5.. 从CSV文件中读取文件113
练习60:从缺少表头的CSV文件中读取数据113
练习61:读取不以逗号为分隔符的CSV文件115
练习62:重置CSV文件的表头116
练习63:读取CSV文件时跳过初始行和页脚116
练习64:结合使用skiprows和nrows来读取小块数据118
5.2.4 使用sheet_name从Excel文件读取数据并处理不同的sheet_name120
5.2.5 从文本文件中读取数据121
练习65:读取一般分隔的文本文件121
5.2.6 从非文本源中读取数据121
练习66:从URL中直接读取HTML表121
练习67:从JSON文件中读取数据1
练习68:从文件读取表格数据124
5.3 BeautifulSoup 4和网页解析简介126
练习69:使用BeautifulSoup读取HTML文件并提取内容127
练习70:DataFrame和BeautifulSup31
练习71:以Excel文件格式导出DataFrame 132
练习72:使用bs4栈文档中的URL133
活动7:从网页读取表格数据并创建DataFrame133
5.4 小结134
第6章 学习数据整理的隐藏秘密135
6.1 引言135
6.2 高级列表推导式和zip函数136
6.2.1 生成器表达式简介136
练习73:生成器表达式136
练习74:一行生成器表达式137
练习75:提取包含单个单词的列表138
6.2.2 zip函数140
练习76:zip函数140
练习77:处理杂乱的数据140
6.3 数据格式化141
6.3.1 %运算符141
6.3.2 使用format函数143
练习78:使用表示数据144
6.4 识别并清除异常值145
练习79:数值数据中的异常值146
练习80:使用z-score去除异常值148
练习81:字符串的模糊匹配149
活动8:异常值和缺失数据的处理150
6.6 小结151
第7章 高级网络抓取和数据收集152
7.1 引言152
7.2 网络抓取和BeautifulSoup库的基础152
7.2.1 Python中的库152
7.2.2 requests库153
练习82:使用requests库从Wikipedia主页获取响应153
练习83:检查网络请求的状态154
练习84:创建一个函数来解码响应的内容并检查其长度155
7.. BeautifulSoup库156
练习85:从BeautifulSoup对象中提取人类可读的文本156
练习86:使用高级bs4技术提取相关文本160
练习87:创建一个紧凑函数来从Wikipedia主页提取“On this day”文本163
7.3 从XML读取数据164
练习88:创建XML文件并读取XML元素对象164
练习89:查找树(元素)中的各种数据元素165
7.3.1 从本地XML文件读取数据到ElementTree对象166
练习90:遍历树,找到根,并探索所有子节点的标签和属166
练习91:使用text方法提取有意义的数据167
7.3.2 使用循环提取和输出人均GDP信息168
练习92:查找并输出每个所有邻国169
练习93:通过网络抓取获得的XML数据的简单使用演示169
7.4 从API读取数据172
7.4.1 定义基URL(或API端点)172
练习94:定义和测试从API提取数据函数173
7.4.2 使用内置的JSON库读取和检查数据174
7.4.3 输出所有数据元素175
7.4.4 使用函数提取包含关键信息的DataFrame176
练习95:通过建立一个息的小型数据库来测试这个函数177
7.5 正则表达式的基础178
7.5.1 网络抓取中的正则表达式178
练习96:使用match方法检查模式与字符串或序列匹配179
7.5.2 使用compile方法创建正则表达式程序179
练习97:编译程序以匹配对象180
练习98:在匹配中使用附加参数来检查特定位置的匹配180
7.5.3 正则表达式中的search方法182
练习99:正则表达式中的search方法182
练习100:使用Match对象的span方法来定位匹配模式的位置182
练习101:使用search进行单字符模式匹配的示例183
练习102:字符串开头或结尾的模式匹配示例184
7.5.4 多种匹配模式185
练习103:多字符模式匹配示例185
练习104:贪婪匹配与非贪婪匹配186
练习105:控制重复次数的匹配187
练习106:匹配字符集188
练习107:在正则表达式中使用OR运算符190
7.5.5 findall方法191
活动9:从古腾堡提取 00的书191
活动10:通过读取API构建自己的电影数据库192
7.6 小结193
第8章 关系数据库管理系统和结构化查询语言195
8.1 引言195
8.2 RDBMS和SL概述196
8.2.1 RDBMS是如何组织的196
8.2.2 SL96
8.3 使用RDBMS(MySL/PostgreSL/SLite)199
8.3.1 使用SLite处理单个表199
练习108:连接到SLite中的数据库199
练习109:SLite中的DDL和DML命令200
练习110:对数据库中的值进行排序202
练习111:更改表的结构并更新新添加的字段202
练习112: 对表中的值进行分组203
8.3.2 数据库中的关系映204
练习113:删除行208
练习114:RDBMS和DataFrame209
活动11:从数据库正确检索数据210
8.4 小结212
第9章 数据整理在现实生活中的应用213
9.1 引言213
9.2 将所学知识应用于现实生活中的数据整理任务213
活动12:数据整理任务—修复联合国数据214
活动13:数据整理任务—清理GDP数据215
活动14:数据整理任务—合并联合国数据和GDP数据216
活动15:数据整理任务—将新数据连接到数据库217
9.3 数据整理拓展延伸217
9.3.1 成为数据科学家所需的额外技能217
9.3.2 大数据和云技术的基础知识218
9.3.3 数据整理的地位219
9.3.4 掌握机器学习的技巧和窍门220
9.4 小结221
附录 活动实施步骤222
亲,大宗购物请点击企业用户渠道>小苏的服务会更贴心!
亲,很抱歉,您购买的宝贝销售异常火爆让小苏措手不及,请稍后再试~
非常抱歉,您前期未参加预订活动,
无法支付尾款哦!
抱歉,您暂无任性付资格