返回首页
苏宁会员
购物车 0
易付宝
手机苏宁

服务体验

店铺评分与同行业相比

用户评价:----

物流时效:----

售后服务:----

  • 服务承诺: 正品保障
  • 公司名称:
  • 所 在 地:

  • 数据科学导论 Python语言(原书第3版)
  • 新华书店正版
    • 作者: (意)阿尔贝托·博斯凯蒂(Alberto Boschetti),(意)卢卡·马萨罗(Luca Massaron)著 | | 于俊伟译
    • 出版社: 机械工业出版社
    • 出版时间:2020-03-01 00:00:00
    送至
  • 由""直接销售和发货,并提供售后服务
  • 加入购物车 购买电子书
    服务

    看了又看

    商品预定流程:

    查看大图
    /
    ×

    苏宁商家

    商家:
    文轩网图书旗舰店
    联系:
    • 商品

    • 服务

    • 物流

    搜索店内商品

    商品分类

         https://product.suning.com/0070067633/11555288247.html

     

    商品参数
    • 作者: (意)阿尔贝托·博斯凯蒂(Alberto Boschetti),(意)卢卡·马萨罗(Luca Massaron)著| 于俊伟译
    • 出版社:机械工业出版社
    • 出版时间:2020-03-01 00:00:00
    • 版次:1
    • 印次:1
    • 印刷时间:2020-03-01
    • 页数:283
    • 开本:16开
    • 装帧:平装
    • ISBN:9787111646693
    • 国别/地区:中国
    • 版权提供:机械工业出版社

    数据科学导论 Python语言(原书第3版)

    作  者:(意)阿尔贝托·博斯凯蒂(Alberto Boschetti),(意)卢卡·马萨罗(Luca Massaron) 著 于俊伟 译
    定  价:79
    出 版 社:机械工业出版社
    出版日期:2020年03月01日
    页  数:283
    装  帧:平装
    ISBN:9787111646693
    主编推荐

    内容简介

    本书对上一版内容进行了全面扩展和更新,将帮助你使用常见的Python库成功地进行数据科学操作。本书提供了对Python核心软件包的前沿见解,包括新版的Jupyter Notebook、Numpy、pandas和Scikit-learn等。本书提供大量详细的示例和大型混合数据集,可以帮助你掌握数据收集、数据改写和分析、可视化和活动报告等基本统计技术。此外,书中不仅介绍了机器学习算法、分布式计算、预测模型调参和自然语言处理等高级数据科学主题,还介绍了深度学习和梯度提升方案(如XGBoost、LightGBM和CatBoost)等内容。通过本书的学习,你将全面了解主要的机器学习算法、图分析技术以及所有可视化工具和部署工具,使你可以更轻松地向数据科学专家和商业用户展示数据处理结果。

    作者简介

    精彩内容

    目录
    译者序
    前言
    作者简介
    审阅者简介
    第1章新手上路1
    1.1数据科学与Python简介1
    1.2Python的安装2
    1.2.1Python 2还是Python 33
    1.2.2分步安装4
    1.2.3安装必要的工具包4
    1.2.4工具包升级6
    1.3科学计算发行版6
    1.3.1Anaconda7
    1.3.2使用conda安装工具包7
    1.3.3Enthought Canopy8
    1.3.4WinPython8
    1.4虚拟环境8
    1.5核心工具包一瞥11
    1.6Jupyter简介18
    1.6.1快速安装与初次使用21
    1.6.2Jupyter魔术命令22
    1.6.3直接从Jupyter Notebook安装软件包23
    1.6.4查看新的JupyterLab环境24
    1.6.5Jupyter Notebook怎样帮助数据科学家24
    1.6.6Jupyter的替代版本29
    1.7本书使用的数据集和代码30
    1.7.1Scikit-learn小规模数据集30
    1.7.2MLdata.org和其他公共资源库32
    1.7.3LIBSVM Data样本33
    1.7.4直接从CSV或文本文件加载数据33
    1.7.5Scikit-learn样本生成器35
    1.8小结36
    第2章数据改写37
    2.1数据科学过程37
    2.2使用pandas进行数据加载与预处理39
    2.2.1数据快捷加载39
    2.2.2处理问题数据41
    2.2.3处理大数据集43
    2.2.4访问其他的数据格式46
    2.2.5合并数据48
    2.2.6数据预处理51
    2.2.7数据选择55
    2.3使用分类数据和文本数据57
    2.3.1特殊的数据类型—文本59
    2.3.2使用Beautiful Soup抓取网页64
    2.4使用Numpy进行数据处理65
    2.4.1NmuPy中的N维数组65
    2.4.2NmuPy ndarray对象基础66
    2.5创建Numpy数组68
    2.5.1从列表到一维数组68
    2.5.2控制内存大小69
    2.5.3异构列表70
    2.5.4从列表到多维数组70
    2.5.5改变数组大小71
    2.5.6利用NumPy函数生成数组73
    2.5.7直接从文件中获得数组73
    2.5.8从pandas提取数据74
    2.6NumPy快速操作和计算75
    2.6.1矩阵运算77
    2.6.2NumPy数组切片和索引78
    2.6.3NumPy数组堆叠80
    2.6.4使用稀疏数组81
    2.7小结83
    第3章数据科学流程84
    3.1EDA简介84
    3.2创建新特征87
    3.3维数约简89
    3.3.1协方差矩阵89
    3.3.2主成分分析90
    3.3.3一种用于大数据的PCA变型—RandomizedPCA93
    3.3.4潜在因素分析94
    3.3.5线性判别分析94
    3.3.6潜在语义分析95
    3.3.7独立成分分析95
    3.3.8核主成分分析96
    3.3.9T-分布邻域嵌入算法97
    3.3.10受限波尔兹曼机98
    3.4异常检测和处理99
    3.4.1单变量异常检测99
    3.4.2EllipticEnvelope101
    3.4.3OneClassSVM104
    3.5验证指标106
    3.5.1多标号分类107
    3.5.2二值分类109
    3.5.3回归110
    3.6测试和验证110
    3.7交叉验证113
    3.7.1使用交叉验证迭代器115
    3.7.2采样和自举方法116
    3.8超参数优化118
    3.8.1建立自定义评分函数120
    3.8.2减少网格搜索时间121
    3.9特征选择123
    3.9.1基于方差的特征选择123
    3.9.2单变量选择124
    3.9.3递归消除125
    3.9.4稳定性选择与基于L1的选择126
    3.10将所有操作包装成工作流程127
    3.10.1特征组合和转换链接128
    3.10.2构建自定义转换函数130
    3.11小结131
    第4章机器学习132
    4.1准备工具和数据集132
    4.2线性和逻辑回归134
    4.3朴素贝叶斯136
    4.4K近邻137
    4.5非线性算法139
    4.5.1基于SVM的分类算法140
    4.5.2基于SVM的回归算法141
    4.5.3调整SVM(优化)142
    4.6组合策略144
    4.6.1基于随机样本的粘贴策略144
    4.6.2基于弱分类器的Bagging策略144
    4.6.3随机子空间和随机分片145
    4.6.4随机森林和Extra-Trees145
    4.6.5从组合估计概率147
    4.6.6模型序列—AdaBoost148
    4.6.7梯度树提升149
    4.6.8XGBoost150
    4.6.9LightGBM152
    4.6.10CatBoost155
    4.7处理大数据158
    4.7.1作为范例创建一些大数据集158
    4.7.2对容量的可扩展性159
    4.7.3保持速度161
    4.7.4处理多样性162
    4.7.5随机梯度下降概述163
    4.8自然语言处理一瞥164
    4.8.1词语分词164
    4.8.2词干提取165
    4.8.3词性标注166
    4.8.4命名实体识别166
    4.8.5停止词167
    4.8.6一个完整的数据科学例子—文本分类168
    4.9无监督学习概览169
    4.9.1K均值算法169
    4.9.2基于密度的聚类技术—DBSCAN172
    4.9.3隐含狄利克雷分布173
    4.10小结177
    第5章可视化、发现和结果178
    5.1matplotlib基础介绍178
    5.1.1曲线绘图179
    5.1.2绘制分块图180
    5.1.3数据中的关系散点图181
    5.1.4直方图182
    5.1.5柱状图183
    5.1.6图像可视化184
    5.1.7pandas的几个图形示例186
    5.1.8通过平行坐标发现模式191
    5.2封装matplotlib命令191
    5.2.1Seaborn简介192
    5.2.2增强EDA性能196
    5.3高级数据学习表示200
    5.3.1学习曲线201
    5.3.2确认曲线202
    5.3.3随机森林的特征重要性203
    5.3.4GBT部分依赖关系图形205
    5.3.5创建MA-AAS预测服务器205
    5.4小结209
    第6章社交网络分析210
    6.1图论简介210
    6.2图的算法215
    6.2.1节点中心性的类型216
    6.2.2网络划分218
    6.3图的装载、输出和采样221
    ……

    售后保障

    最近浏览

    猜你喜欢

    该商品在当前城市正在进行 促销

    注:参加抢购将不再享受其他优惠活动

    x
    您已成功将商品加入收藏夹

    查看我的收藏夹

    确定

    非常抱歉,您前期未参加预订活动,
    无法支付尾款哦!

    关闭

    抱歉,您暂无任性付资格

    此时为正式期SUPER会员专享抢购期,普通会员暂不可抢购