文轩网图书旗舰店
  • 扫码下单

  • Python中文自然语言处理基础与实战 肖刚,张良均 著 大中专 文轩网
  • 新华书店正版
    • 作者: 肖刚,张良均著
    • 出版社: 人民邮电出版社
    • 出版时间:2022-01-01 00:00:00
    送至
  • 由""直接销售和发货,并提供售后服务
  • 加入购物车 购买电子书
    服务

    看了又看

    商品预定流程:

    查看大图
    /
    ×

    店铺装修中

    商家:
    文轩网图书旗舰店
    联系:
    • 商品

    • 服务

    • 物流

    搜索店内商品

    文轩网图书旗舰店

  •      https://product.suning.com/0070067633/11555288247.html

     

    商品参数
    • 作者: 肖刚,张良均著
    • 出版社:人民邮电出版社
    • 出版时间:2022-01-01 00:00:00
    • 版次:1
    • 印次:1
    • 印刷时间:2022-01-01
    • 页数:236
    • 开本:16开
    • 装帧:平装
    • ISBN:9787115566881
    • 国别/地区:中国
    • 版权提供:人民邮电出版社

    Python中文自然语言处理基础与实战

    作  者:肖刚,张良均 著
    定  价:59.8
    出 版 社:人民邮电出版社
    出版日期:2022年01月01日
    页  数:236
    装  帧:平装
    ISBN:9787115566881
    主编推荐

    欢迎加入人邮大数据教师服务群:669819871 1.内容契合“1+X”证书制度试点工作中的大数据应用开发(Python)职业技能不错证书考核标准 2.全书与真实案例相结合,方便读者系统学习并动手实践 3.全书紧扣任务需求展开,不堆积知识点,着重于思路的启发与解决方案的实施

    内容简介

    本书以Python自然语言处理的常用技术与真实案例相结合的方式,深入浅出地介绍Python自然语言处理的重要内容。全书共12章,内容包括绪论、语料库、正则表达式、中文分词技术、词性标注与命名实体识别、关键词提取、文本向量化、文本分类与文本聚类、文本情感分析、NLP中的深度学习技术、智能问答系统,以及基于TipDM大数据挖掘建模平台实现垃圾短信分类。本书包含实训和课后习题,帮助读者通过练习和操作实践,巩固所学内容。 本书可作为“1+X”证书制度试点工作中“大数据应用开发(Python)”职业技能等级证书的教学和培训用书,也可以作为高校数据科学或人工智能相关专业的教材,还可作为机器学习爱好者的自学用书。

    作者简介

    肖刚(1968-),博士,教授。韩山师范学院数学与统计学院院长、广东省中小型企业大数据与智能化工程研究中心主任,华南师范大学、广州大学兼职硕士生导师。中国医学装备协会磁共振成像装备与技术专业委员会委员、广东省生物医学工程学会医学信息工程分会委员、广东省工业与应用数学学会、广东省现场统计学会和广东省计算数学学会理事,“泰迪杯”全国数据挖掘挑战赛专家组成员。主要从事应用数学、数据挖掘和医学影像学的研究工作以及创新创业竞赛、数学建模竞赛、数据挖掘挑战赛的教学与指导工作。主持广东省自然科学基金项目2项,主持广东省教育厅项目4项。2016年广东省科学技术进步奖三等奖、2018年汕头科学技术奖一等奖、2019年广东省科学技术进步奖很好奖以及2019年广东省教学成果(基础教育)一等奖主要成员。 张良均。不错信息系统项目管理师,泰迪杯全国大学生数据挖掘竞赛(www.tipdm.org)的发起人。华南师范大null

    精彩内容

    目录
    第 1章 绪论  1 1.1  自然语言处理概述  1 1.1.1  NLP的发展历程  2 1.1.2  NLP研究内容  3 1.1.3  NLP的几个应用场景  4 1.1.4  NLP与人工智能技术  5 1.1.5  学习NLP的难点  6 1.2  NLP基本流程  6 1.2.1  语料获取  6 1.2.2  语料预处理  7 1.2.3  文本向量化  7 1.2.4  模型构建  7 1.2.5  模型训练  7 1.2.6  模型评价  8 1.3  NLP的开发环境  8 1.3.1  Anaconda安装  8 1.3.2  Anaconda应用介绍  9 小结  14 课后习题  14 第  2章 语料库  16 2.1  语料库概述  16 2.1.1  语料库简介  16 2.1.2  语料库的用途  17 2.2  语料库的种类与构建原则  17 2.2.1  语料库的种类  17 2.2.2  语料库的构建原则  18 2.3  NLTK  19 2.3.1  NLTK简介  19 2.3.2  安装步骤  19 2.3.3  NLTK中函数的使用  21 2.4  语料库的获取  23 2.4.1  获取NLTK语料库  23 2.4.2  获取网络在线语料库  30 2.5  任务:语料库的构建与应用  32 2.5.1  构建作品集语料库  32 2.5.2  武侠小说语料库分析  33 小结  35 实训  35 实训1  构建语料库  35 实训2  《七剑下天山》语料库分析  36 课后习题  36 第3章  正则表达式  38 3.1  正则表达式的概念  38 3.1.1  正则表达式函数  38 3.1.2  正则表达式的元字符  40 3.2  任务:正则表达式的应用  43 3.2.1  《西游记》字符过滤  43 3.2.2  自动提取人名与电话号码  44 3.2.3  提取网页标签信息  45 小结  46 实训  46 实训1  过滤《三国志》中的字符  46 实训2  提取地名与邮编  46 实训3  提取网页标签中的文本  46 课后习题  47 第4章  中文分词技术  48 4.1  中文分词简介  48 4.2  基于规则分词  48 4.2.1  正向优选匹配法  49 4.2.2  逆向优选匹配法  49 4.2.3  双向优选匹配法  50 4.3  基于统计分词  51 4.3.1  n元语法模型  51 4.3.2  隐马尔可夫模型相关概念  55 4.4  中文分词工具jieba  62 4.4.1  基本步骤  63 4.4.2  分词模式  63 4.5  任务:中文分词的应用  64 4.5.1  HMM中文分词  64 4.5.2  提取新闻文本中的高频词  68 小结  69 实训  70 实训1  使用HMM进行中文分词  70 实训2  提取文本中的高频词  70 课后习题  70 第5章  词性标注与命名实体识别  72 5.1  词性标注  72 5.1.1  词性标注简介  72 5.1.2  词性标注规范  73 5.1.3  jieba词性标注  74 5.2  命名实体识别  77 5.2.1  命名实体识别简介  77 5.2.2  CRF模型  78 5.3  任务:中文命名实体识别  82 5.3.1  sklearn-crfsuite库简介  83 5.3.2  命名实体识别流程  83 小结  90 实训  中文命名实体识别  90 课后习题  91 第6章  关键词提取  92 6.1  关键词提取技术简介  92 6.2  关键词提取算法  93 6.2.1  TF-IDF算法  93 6.2.2  TextRank算法  94 6.2.3  LSA与LDA算法  96 6.3  任务:自动提取文本关键词  103 小结  109 实训  109 实训1  文本预处理  109 实训2  使用TF-IDF算法提取关键词  109 实训3  使用TextRank算法提取关键词  110 实训4  使用LSA算法提取关键词  110 课后习题  110 第7章  文本向量化  112 7.1  文本向量化简介  112 7.2  文本离散表示  113 7.2.1  独热表示  113 7.2.2  BOW模型  113 7.2.3  TF-IDF表示  114 7.3  文本分布式表示  114 7.3.1  Word2Vec模型  114 7.3.2  Doc2Vec模型  118 7.4  任务:文本相似度计算  120 7.4.1  Word2Vec词向量的训练  121 7.4.2  Doc2Vec段落向量的训练  122 7.4.3  计算文本的相似度  124 小结  128 实训  128 实训1  实现基于Word2Vec模型的新闻语料词向量训练  128 实训2  实现基于Doc2Vec模型的新闻语料段落向量训练  128 实训3  使用Word2Vec模型和Doc2Vec模型计算新闻文本的相似度  129 课后习题  129 第8章  文本分类与文本聚类  131 8.1  文本挖掘简介  131 8.2  文本分类常用算法  132 8.3  文本聚类常用算法  133 8.4  文本分类与文本聚类的步骤  135 8.5  任务:垃圾短信分类  136 8.6  任务:新闻文本聚类  141 小结  144 实训  144 实训1  基于朴素贝叶斯的新闻分类  144 实训2  食品种类安全问题聚类分析  145 课后习题  145 第9章  文本情感分析  147 9.1  文本情感分析简介  147 9.1.1  文本情感分析的主要内容  147 9.1.2  文本情感分析的常见应用  148 9.2  情感分析的常用方法  149 9.2.1  基于情感词典的方法  149 9.2.2  基于文本分类的方法  150 9.2.3  基于LDA主题模型的方法  151 9.3  任务:基于情感词典的情感分析  151 9.4  任务:基于文本分类的情感分析  154 9.4.1  基于朴素贝叶斯分类的情感分析  154 9.4.2  基于SnowNLP库的情感分析  156 9.5  任务:基于LDA主题模型的情感分析  157 9.5.1  数据处理  157 9.5.2  模型训练  158 9.5.3  结果分析  159 小结  160 实训  160 实训1  基于词典的豆瓣评论文本情感分析  160 实训2  基于朴素贝叶斯算法的豆瓣评论文本情感分析  160 实训3  基于SnowNLP的豆瓣评论文本情感分析  161 实训4  基于LDA主题模型的豆瓣评论文本情感分析  161 课后习题  161 第  10章 NLP中的深度学习技术  163 10.1  循环神经网络概述  163 10.2  RNN结构  164 10.2.1  多对一结构  164 10.2.2  等长的多对多结构  164 10.2.3  非等长结构(Seq2Seq模型)  169 10.3  深度学习工具  171 10.3.1  TensorFlow简介  171 10.3.2  基于TensorFlow的深度学习库Keras  172 10.4  任务:基于LSTM的文本分类与情感分析  172 10.4.1  文本分类  172 10.4.2  情感分析  181 10.5  任务:基于Seq2Seq的机器翻译  185 10.5.1  语料预处理  185 10.5.2  构建模型  188 10.5.3  定义优化器和损失函数  191 10.5.4  训练模型  191 10.5.5  翻译  194 小结  195 实训  195 实训1  实现基于LSTM模型的新闻分类  195 实训2  实现基于LSTM模型的携程网评论情感分析  196 实训3  实现基于Seq2Seq和GPU的机器翻译  196 课后习题  197 第  11章 智能问答系统  198 11.1  智能问答系统简介  198 11.2  智能问答系统的主要组成部分  198 11.2.1  问题理解  199 11.2.2  知识检索  199 11.2.3  答案生成  200 11.3  任务:基于Seq2Seq模型的聊天机器人  201 11.3.1  读取语料库  201 11.3.2  文本预处理  202 11.3.3  模型构建  206 11.3.4  模型训练  211 11.3.5  模型评价  218 小结  218 实训  基于Seq2Seq模型的聊天机器人  218 课后习题  219 第  12章 基于TipDM大数据挖掘建模平台实现垃圾短信分类  220 12.1  平台简介  220 12.1.1  实训库  221 12.1.2  数据连接  222 12.1.3  实训数据  222 12.1.4  我的实训  223 12.1.5  系统算法  223 12.1.6  个人算法  225 12.2  实现垃圾短信分类  226 12.2.1  数据源配置  227 12.2.2  文本预处理  229 12.2.3  朴素贝叶斯分类模型  234 小结  235 实训  实现基于朴素贝叶斯的新闻分类  235 课后习题  236

    售后保障

    最近浏览

    猜你喜欢

    该商品在当前城市正在进行 促销

    注:参加抢购将不再享受其他优惠活动

    x
    您已成功将商品加入收藏夹

    查看我的收藏夹

    确定

    非常抱歉,您前期未参加预订活动,
    无法支付尾款哦!

    关闭

    抱歉,您暂无任性付资格

    此时为正式期SUPER会员专享抢购期,普通会员暂不可抢购