返回首页
苏宁会员
购物车 0
易付宝 企业采购
手机苏宁

服务体验

店铺评分与同行业相比

用户评价:----

物流时效:----

售后服务:----

  • 服务承诺: 正品保障
  • 公司名称:
  • 所 在 地:
  • 客服电话:

超级新品 全新正版 套路!机器学习:北美数据科学家的私房课

  • 作者: 林荟著
  • 出版社: 电子工业出版社
  • 出版时间:2017-10-01
送至
由""直接销售和发货,并提供售后服务 联系客服
加入购物车 购买电子书
服务
企业采购 针对企业客户采购的专业服务

看了又看

商品预定流程:

查看大图
/
×

苏宁商家

商家:
诚哲图书
联系:
联系客服
电话:

17509173691

  • 商品

  • 服务

  • 物流

搜索店内商品

商品分类

商品参数
  • 作者: 林荟著
  • 出版社:电子工业出版社
  • 出版时间:2017-10-01
  • 版次:1
  • 开本:128开
  • 装帧:平装
  • ISBN:9787121326585
  • 版权提供:电子工业出版社

基本信息

书名:套路!机器学习:北美数据科学家的私房课

定价:68.00元

作者:林荟

出版社:电子工业出版社

出版日期:2017-10-01

ISBN:9787121326585

字数:

页码:

版次:1

装帧:平装-胶订

开本:128开

商品重量:0.4kg

编辑推荐


数据科学家李明博士、统计之都创始人谢益辉博士抢先品读
当前关于大数据、人工智能的炒作着实令人眼花缭乱,如大数据平台(如Hadoop、Spark),以及一些黑箱模型,如神经网络,深度学习(实际上就是多层神经网络)。各路媒体和“砖家”深谙吃瓜群众不明觉厉的心态,所以就像个“妓院头牌“似的越发摆谱。作者并没有打算写一本数据科学的圣经,告诉你所有关于数据科学的一切;只想尽可能地给大家还原一个真实的数据科学和数据科学家。希望能为后来者提供一些信息,使得读者们能够少走弯路。

内容提要


数据科学家目前是北美zui热门的职业之一,平均年薪突破10万美元。但数据科学并不是一个低门槛的行业,除了对数学、统计、计算机等相关领域的技术要求以外,还要相关应用领域的知识。《套路!机器学习》的写作对象是那些现在从事数据分析相关行业,或者之后想从事数据分析行业的人,意在为实践者提供数据科学家这门职业的相关信息。读者可以从阅读中了解到数据科学能解决的问题,数据科学家需要的技能,及背后的“分析哲学”。对于新手而言,一开始就直奔艰深的理论,很容易因为困难而失去兴趣zui终放弃。因此《套路!机器学习》倡导的是一种循序渐进的启发教学路径,着重在于数据科学的实际应用,让读者能够重复书中的结果,学习数据分析技能zui好的方式是实践!为了平衡理论和应用,书中包括了一些选学小节,用来介绍更多的模型数理背景或给出必要的参考资料来源。抽丝剥茧介绍技术内核,帮助大家知其然,同时知其所以然。希望笔者在北美从事数据科学工作多年踏遍大大小小不计其数的坑换来的经验,能够帮助读者更加顺利地成为数据科学家!

目录


第1章 白话数据科学1
1.1 什么是数据科学3
1.2 什么是数据科学家5
1.2.1 数据科学家需要的技能6
1.2.2 数据科学算法总结10
1.3 数据科学可以解决什么问题20
1.3.1 前提要求20
1.3.2 问题种类22
1.4 小结25
第2章 数据集26
2.1 服装消费者数据26
2.2 航空公司满意度调查33
2.3 生猪疫情风险预测数据37
第3章 数据分析流程41
3.1 从问题到数据42
3.2 从数据到信息44
3.3 从信息到行动46
第4章 数据预处理47
4.1 介绍47
4.2 数据清理50
4.3 缺失值填补52
4.3.1 中位数或众数填补53
4.3.2 K-近邻填补54
4.3.3 装袋树填补56
4.4 中心化和标量化56
4.5 有偏分布59
4.6 处理离群点63
4.7 共线性66
4.8 稀疏变量70
4.9 编码名义变量71
4.10 小结73
第5章 数据操作75
5.1 数据读写76
5.1.1 取代传统数据框的tibble对象76
5.1.2 高效数据读写:readr包80
5.1.3 数据表对象读取83
5.2 数据整合91
5.2.1 base包:apply()91
5.2.2 plyr包:ddply()函数93
5.2.3 dplyr包96
5.3 数据整形102
5.3.1 reshape2包102
5.3.2 tidyr包105
5.4 小结107
第6章 基础建模技术109
6.1 有监督和无监督109
6.2 误差及其来源111
6.2.1 系统误差和随ji误差111
6.2.2 因变量误差117
6.2.3 自变量误差121
6.3 数据划分和再抽样122
6.3.1 划分训练集和测试集123
6.3.2 重抽样131
6.4 小结135
第7章 模型评估度量136
7.1 回归模型评估度量136
7.2 分类模型评估度量139
7.2.1 Kappa统计量141
7.2.2 ROC曲线143
7.2.3 提升图145
7.3 小结146
第8章 特征工程148
8.1 特征构建149
8.2 特征提取152
8.2.1 初步探索特征153
8.2.2 主成分分析158
8.2.3 探索性因子分析163
8.2.4 高维标度化167
8.2.5 知识扩展:3种降维特征提取方法的理论171
8.3 特征选择177
8.3.1 过滤法178
8.3.2 绕封法188
8.4 小结195
第9章 线性回归及其衍生196
9.1 普通线性回归197
9.1.1 zui小二乘线性模型197
9.1.2 回归诊断201
9.1.3 离群点、高杠杆点和强影响点204
9.2 收缩方法205
9.2.1 岭回归205
9.2.2 Lasso209
9.2.3 弹络212
9.3 知识扩展:LASSO的变量选择功能213
9.4 主成分和偏小二乘回归215
9.5 小结221
第10章 广义线性模型压缩方法222
10.1 初识GLMNET223
10.2 收缩线性回归227
10.3 逻辑回归235
10.3.1 普通逻辑回归235
10.3.2 收缩逻辑回归236
10.3.3 知识扩展:群组lasso逻辑回归239
10.4 收缩多项回归243
10.5 泊松收缩回归246
10.6 小结249
第11章 树模型250
11.1 分裂准则252
11.2 树的修剪256
11.3 回归树和决策树260
11.4 装袋树268
11.5 随ji森林273
11.6 助推法277
11.7 知识扩展:助推法的可加模型框架283
11.8 知识扩展:助推树的数学框架286
11.8.1 数学表达286
11.8.2 梯度助推数值优化289
11.9 小结290
第12章 神经网络292
12.1 投影寻踪回归(PROJECTION PURSUIT REGRESSION)293
12.2 神经网络(NEURAL NETWORKS)296
12.3 神经网络拟合299
12.4 训练神经网络300
12.5 用CARET包训练神经网络302
12.6 小结311
参考文献312

作者介绍


2013年至今任美国杜邦公司商业数据科学家。北京师范大学数学科学学院本科,爱荷华州立大学统计学院硕士和博士。曾任爱荷华州立大学兽医学院统计咨询师(2009-2013)及商学院分析咨询师(2012-2013)。当选2017-2018美国统计协会市场营销统计项目。翻译出版了《应用预测建模》和《R语言市场研究分析》。

文摘


序言


售后保障

最近浏览

猜你喜欢

该商品在当前城市正在进行 促销

注:参加抢购将不再享受其他优惠活动

x
您已成功将商品加入收藏夹

查看我的收藏夹

确定

非常抱歉,您前期未参加预订活动,
无法支付尾款哦!

关闭

抱歉,您暂无任性付资格

此时为正式期SUPER会员专享抢购期,普通会员暂不可抢购