返回首页
苏宁会员
购物车 0
易付宝
手机苏宁

服务体验

店铺评分与同行业相比

用户评价:----

物流时效:----

售后服务:----

  • 服务承诺: 正品保障
  • 公司名称:
  • 所 在 地:
本店所有商品

  • [正版]文本数据挖掘与Python应用 刘金岭 Python数据挖掘数据采集软件程序
  • 本书讲解文本数据挖掘的原理和技术通俗易懂
    • 作者: 刘金岭著
    • 出版社: 清华大学出版社
    送至
  • 由""直接销售和发货,并提供售后服务
  • 加入购物车 购买电子书
    服务

    看了又看

    商品预定流程:

    查看大图
    /
    ×

    苏宁商家

    商家:
    友一个文化制品专营店
    联系:
    • 商品

    • 服务

    • 物流

    搜索店内商品

    商品分类

    商品参数
    • 作者: 刘金岭著
    • 出版社:清华大学出版社
    • 开本:16开
    • ISBN:9781960328896
    • 版权提供:清华大学出版社

            铺公告

      为保障消费者合理购买需求及公平交易机会,避免因非生活消费目的的购买货囤积商品,抬价转售等违法行为发生,店铺有权对异常订单不发货且不进行赔付。异常订单:包括但不限于相同用户ID批量下单,同一用户(指不同用户ID,存在相同/临近/虚构收货地址,或相同联系号码,收件人,同账户付款人等情形的)批量下单(一次性大于5本),以及其他非消费目的的交易订单。

    温馨提示:请务必当着快递员面开箱验货,如发现破损,请立即拍照拒收,如验货有问题请及时联系在线客服处理,(如开箱验货时发现破损,所产生运费由我司承担,一经签收即为货物完好,如果您未开箱验货,一切损失就需要由买家承担,所以请买家一定要仔细验货)。

      关于退货运费:对于下单后且物流已发货货品在途的状态下,原则上均不接受退货申请,如顾客原因退货需要承担来回运费,如因产品质量问题(非破损问题)可在签收后,联系在线客服。

     

     

     书名:  文本数据挖掘与Python应用
     出版社:  清华大学出版社
     出版日期  2021
     ISBN号:  9787302557869
      教材系统地介绍文本数据挖掘的相关概念,利用Python作为工具进行相关试验,其内容主要包括:文本挖掘产生的背景及发展;文本挖掘的概念、文本模型表示、文本内容的预处理,包括分词、去停用词以及特征抽取;文本相似度的概念等。介绍文本分类的概念及常用方法,如KNN算法、SVM算法等,并对分类结果进行评价;在介绍文本聚类聚类的概念时是,同样介绍聚类常用算法,如K均值算法、层次聚类法、密度聚类法等,作为有文本分类、文本聚类的应用,最后给出了信息抽取、社会网络中的实体关系抽取和事件抽取。

    刘金岭,教授,硕士生导师。至2007年以来进行文本数据挖掘的研究,在专业核心期刊发表相关论文30多篇,EI检索4篇,SCCSI检索3篇。在2010-2013年与江苏移动公司合作进行垃圾短信处理研究,2009-2011完成市级科研课题“基于语义的垃圾短信分类器设计与实现(HAG09061)”。

    本书系统地介绍文本数据挖掘的相关概念,利用Python作为工具进行相关试验,通俗易懂,实用性强。适合于做教材。

    源码下载


    第1章绪论


    1.1文本挖掘的研究背景及意义


    1.2文本挖掘的国内外研究现状


    1.3文本挖掘概述


    1.3.1文本挖掘的概念


    1.3.2文本挖掘的任务


    1.3.3文本挖掘与数据挖掘的联系与区别


    1.4文本挖掘的过程


    1.5文本挖掘的主要研究领域


    1.5.1文本特征选择


    1.5.2文本结构分析


    1.5.3文本摘要


    1.5.4文本分类


    1.5.5文本聚类


    1.5.6文本关联分析


    1.5.7分布分析与趋势预测


    1.6文本挖掘在制药行业的应用案例


    习题1


    第2章文本切分及特征词选择


    2.1文本数据采集


    2.1.1软件接口对接方式


    2.1.2开放数据库方式


    2.1.3基于底层数据交换的数据直接采集方式


    2.1.4网络爬虫采集网页数据


    2.2语料库与词典简介


    2.2.1语料库


    2.2.2词典


    2.3文本切分


    2.3.1句子切分


    2.3.2词汇切分


    2.4文本特征词选择


    2.4.1文本特征词选择概述


    2.4.2常用的文本特征词选择方法


    2.5Python jieba分词模块及其用法


    2.5.1jieba方法


    2.5.2基于规则的中文分词


    2.5.3关键词提取


    习题2






    第3章文本表示模型


    3.1文本预处理


    3.1.1原始数据处理


    3.1.2文本预处理简述


    3.2向量空间模型


    3.2.1向量空间模型的概念


    3.2.2文本向量的相似度


    3.2.3向量模型的Python实现


    3.3概率模型


    3.3.1概率模型概述


    3.3.2概率建模方法


    3.3.3文本信息检索中的概率模型


    3.3.4概率模型的Python实现


    3.4概率主题模型


    3.4.1概率主题模型概述


    3.4.2PLSA概率主题模型


    3.4.3LDA概率主题模型


    3.4.4LDA概率主题模型的Python实现


    习题3


    第4章文本分类


    4.1文本分类概述


    4.1.1研究的意义


    4.1.2国内外研究现状与发展趋势


    4.1.3文本分类的定义


    4.1.4文本分类流程


    4.1.5文本分类预处理


    4.2常用文本分类器


    4.2.1KNN分类器


    4.2.2SVM分类器


    4.2.3Rocchio分类器


    4.2.4朴素贝叶斯分类器


    4.2.5决策树分类器


    4.3分类模型的性能评估


    4.3.1分类评价方法


    4.3.2分类性能评价指标


    习题4


    第5章文本聚类


    5.1文本聚类概述


    5.1.1研究的意义


    5.1.2国内外研究现状与发展趋势


    5.1.3文本聚类的定义


    5.1.4文本聚类流程


    5.1.5对聚类算法的性能要求


    5.2文本聚类原理与方法


    5.2.1基于划分的方法


    5.2.2基于层次的方法


    5.2.3基于密度的方法


    5.2.4基于网格的方法


    5.2.5基于模型的方法


    5.3文本聚类评估


    5.3.1估计聚类趋势


    5.3.2确定簇数


    5.3.3测定聚类质量


    习题5


    第6章文本关联分析


    6.1关联规则挖掘概述


    6.2文本关联规则


    6.2.1关联规则的基本概念


    6.2.2关联规则分类


    6.3关联规则挖掘算法


    6.3.1Apriori算法


    6.3.2FPGrowth算法


    习题6


    第7章利用Python处理文本数据简单应用


    7.1情感分析


    7.1.1情感分析原理


    7.1.2算法设计


    7.1.3算法实现


    7.2自动生成关键词和摘要


    7.2.1TextRank算法


    7.2.2生成关键词和摘要


    7.3使用SnowNLP进行商品评价


    7.3.1SnowNLP库简介


    7.3.2SnowNLP商品评价


    7.4生成“词云”


    7.4.1“词云”的概念


    7.4.2Python“词云”图的生成


    习题7


    参考文献

    随着互联网和移动通信技术的快速发展和普及应用,文本挖掘技术备受关注,尤其随着云计算、大数据和深度学习等一系列新技术的广泛使用,文本挖掘技术已经在众多领域(如舆情分析、医疗和金融数据分析等)发挥了重要作用,具有广阔的应用前景。


    目前许多教材都是针对英文文本挖掘编写的,笔者将研究对象锁定在中文文本处理,系统讲述了中文文本理解的基本理论,列举研究成果,使之更加适合作为中文文本理解的工具书。本书的参考文献给出了许多中文信息处理的资源,读者可以由此找到所需的中文语料和工具集。


    本书以中文文本数据为处理对象,对文本挖掘中的若干经典算法进行了阐述,主要包括分词、特征提取、文本表示、文本分类、文本聚类和文本关联规则。作为应用,第7章利用Python给出了处理文本数据的几个简单案例。


    Python在数据挖掘和数据分析方面有着强大的功能,尤其是含有许多调用库,基本上已经达到了

    应有尽有的程度。例如,NumPy(Numeric Python)提供了许多高级的数值编程工具,如

    矩阵数据类型、矢量处理,以及精密的运算库,这些是Python的一种开源的数值计算扩展。

    此外,还有基于Python的机器学习模块sklearn(ScikitLearn)等,所以Python用起来非常方便。在中文文本处理方面Python提供了比较成熟的jieba中文词库,以及用Python编写的类库SnowNLP,可以方便地处理中文文本内容。


    本书的Python实验是利用Python 3.6(64位)完成的。

    本书配套资源丰富,包括教学大纲、教学课件、电子教案、习题答案、实验指导和教学进度表,扫描封底的“课件下载”二维码,在公众号“书圈”下载; 本书还提供程序源码,扫描目录上方的二维码下载。

    本书的编写得到了蔡博、郭倩倩和王红老师的大力帮助,

    在此一并向他们表示衷心的感谢!

    由于笔者知识水平有限,如有欠妥之处,敬请批评、指正。


    刘金岭钱升华2020年8月


    1
    • 商品详情
    • 内容简介

    售后保障

    最近浏览

    猜你喜欢

    该商品在当前城市正在进行 促销

    注:参加抢购将不再享受其他优惠活动

    x
    您已成功将商品加入收藏夹

    查看我的收藏夹

    确定

    非常抱歉,您前期未参加预订活动,
    无法支付尾款哦!

    关闭

    抱歉,您暂无任性付资格

    此时为正式期SUPER会员专享抢购期,普通会员暂不可抢购