返回首页
苏宁会员
购物车 0
易付宝
手机苏宁

服务体验

店铺评分与同行业相比

用户评价:----

物流时效:----

售后服务:----

  • 服务承诺: 正品保障
  • 公司名称:
  • 所 在 地:

  • WEB大数据处理与分析 夏换,杨秀璋,于小民 著 专业科技 文轩网
  • 新华书店正版
    • 作者: 夏换,杨秀璋,于小民著
    • 出版社: 科学出版社
    • 出版时间:2019-03-01 00:00:00
    送至
  • 由""直接销售和发货,并提供售后服务
  • 加入购物车 购买电子书
    服务

    看了又看

    商品预定流程:

    查看大图
    /
    ×

    苏宁商家

    商家:
    文轩网图书旗舰店
    联系:
    • 商品

    • 服务

    • 物流

    搜索店内商品

    商品分类

         https://product.suning.com/0070067633/11555288247.html

     

    商品参数
    • 作者: 夏换,杨秀璋,于小民著
    • 出版社:科学出版社
    • 出版时间:2019-03-01 00:00:00
    • 版次:1
    • 字数:250000
    • 页数:292
    • 开本:B5
    • 装帧:平装
    • ISBN:9787030606365
    • 国别/地区:中国
    • 版权提供:科学出版社

    WEB大数据处理与分析

    作  者:夏换,杨秀璋,于小民 著
    定  价:152
    出 版 社:科学出版社
    出版日期:2019年03月01日
    页  数:292
    装  帧:平装
    ISBN:9787030606365
    主编推荐

    内容简介

    随着计算机和互联网技术的飞速发展和广泛普及,互联网已经成为人类获取知识的很大平台。在爬取了Web网页语料后,需要通过数据预处理和数据分析来获取数据的价值,从而造福人类,推动社会发展。本书主要是Web大数据预处理和数据分析的实战指南,内容包括三部分:基础知识、基于Python的数据预处理、基于Python的数据分析

    作者简介

    精彩内容

        部分 基础知识
         章 概述
        本书主要介绍Web 大数据(Big Data)的数据预处理和数据分析,主要从三个部分进行详细讲解。部分介绍基础知识,包括数据挖掘(Data Mining)基础知识、结构化查询语言(structured query language,SQL)与关系型数据库、正则表达式和基本字符串函数等;第二部分介绍基于Python 的大数据预处理,包括中文分词、停用词过滤、特征提取、向量空间模型(vector space model,VSM)、权重计算等;第三部分讲述对数据的分析与处理。
        部分主要介绍Web 大数据数据预处理与分析的基础知识,为后面的具体操作做准备,主要讲述null

    目录
    目录
    部分 基础知识
    章 概述 3
    1.1 大数据预处理和分析 3
    1.2 各章概要 8
    1.3 如何阅读本书 12
    第2章 数据挖掘基础知识 14
    2.1 数据挖掘 14
    2.2 有监督学习 16
    2.3 无监督学习 17
    2.4 部分监督学习 19
    第3章 关系型数据库和语料知识库 21
    3.1 关系型数据库 21
    3.2 SQL基础知识 23
    3.3 Python调用数据库 32
    3.4 常见的语料知识库 39
    第4章 正则表达式和基本字符串函数 48
    4.1 正则表达式 48
    4.2 基本字符串函数 58
    4.3 字符编码简介 64
    第二部分 基于Python的大数据预处理
    第5章 数据预处理相关介绍 71
    5.1 预处理概述 71
    5.2 中文分词 72
    5.3 数据清洗 74
    5.4 词性标注基础 75
    5.5 向量空间模型及特征提取 76
    5.6 权重计算 76
    第6章 中文分词技术及Jieba工具 77
    6.1 中文分词技术介绍 77
    6.2 常用中文分词工具 80
    6.3 Jieba中文分词工具 81
    6.4 案例分析:使用Jieba对百度百科摘要信息进行中文分词 91
    第7章 数据清洗及停用词过滤 94
    7.1 数据清洗的概念 94
    7.2 数据清洗常见方法 97
    7.3 停用词过滤 98
    第8章 词性标注 106
    8.1 词性标注概述 106
    8.2 BosonNLP词性标注 109
    8.3 Jieba工具词性标注 115
    8.4 案例分析:基于Jieba工具的词性标注 120
    第9章 向量空间模型及特征提取 124
    9.1 向量空间模型 124
    9.2 特征提取 126
    9.3 余弦相似性 129
    9.4 案例分析:基于向量空间模型的余弦相似度计算 131
    0章 权重计算及TF-IDF 139
    10.1 权重计算 139
    10.2 TF-IDF 141
    10.3 Scikit-Learn中的TF-IDF使用方法 143
    10.4 案例分析:TF-IDF计算中文语料权重 146
    第三部分 基于Python的大数据分析
    1章 Python大数据分析的常用库介绍 157
    11.1 数据挖掘概述 157
    11.2 开发软件安装过程 159
    11.3 Scikit-Learn库 165
    11.4 NumPy、SciPy、Matplotlib库 169
    2章 基于Python的聚类数据分析 175
    12.1 聚类概述 175
    12.2 聚类算法基本用法 178
    12.3 案例分析:基于Birch层次聚类算法及PAC降维显示聚类图像 190
    3章 基于Python的分类算法分析 206
    13.1 分类概述 206
    13.2 Python分类算法基本用法 214
    13.3 案例分析:基于新闻数据分类算法的示例 229
    4章 基于Python的LDA主题模型 242
    14.1 LDA主题模型 242
    14.2 LDA安装过程 244
    14.3 LDA基本用法 245
    14.4 案例分析:LDA主题模型分布计算 254
    5章 基于Python的神经网络分析 265
    15.1 神经网络的基础知识 265
    15.2 神经网络的Python简单实现 271
    15.3 Python神经网络工具包 275
    15.4 案例分析:使用神经网络训练 280
    参考文献 283

    售后保障

    最近浏览

    猜你喜欢

    该商品在当前城市正在进行 促销

    注:参加抢购将不再享受其他优惠活动

    x
    您已成功将商品加入收藏夹

    查看我的收藏夹

    确定

    非常抱歉,您前期未参加预订活动,
    无法支付尾款哦!

    关闭

    抱歉,您暂无任性付资格

    此时为正式期SUPER会员专享抢购期,普通会员暂不可抢购