《Python中文自然语言处理基础与实战》肖刚，张良均著著【摘要书评在线阅读】-苏宁易购图书

云钻刮券活动规则

活动时间

活动自2017年6月2日上线，敬请关注云钻刮券活动规则更新。

活动形式

会员打开苏宁易购wap端、PC端、苏宁易购APP端方可参与活动。
活动方式为云钻刮券，每次刮券需要扣除200云钻。奖励分为无敌券和店铺云券两种，100%刮出无敌券，最低2元。店铺券由店铺提供，用户可以根据购物需求，在无敌券和店铺云券之间二选一。如因为网络、用户关闭等原因，造成页面关闭，导致用户没有或无法选择，系统将在5分钟内自动按照获得的无敌券面额发放到用户账户。
每人每天参与刮券次数上限为1次。活动每日限量，如用户参与时已达到活动最高上限，则不能再继续参与，次日可以继续参与。
如会员在刮券时选择了店铺云券，券发至账户后则无法再更改为平台的无敌券；如会员在刮券时选择了平台的无敌券，券发至账户后则无法再更改为店铺云券。
云钻刮券获得的不固定面值的券，会随机获得无敌券：2~2.2元、5元、10元、20元、50元的无敌券或不同面额的店铺云券。
券是否成功发放，可在“我的优惠券”中查询。

其他

如活动受政府机关指令需要停止举办的，或活动遭受严重网络攻击需暂停举办的，或者系统故障导致的其它意外问题，苏宁无需为此承担赔偿或者进行补偿。

券使用规则

不同面额的无敌券有不同的使用门槛，2~2.2元、5元、10元、20元、50元无敌券为无门槛使用，具体以实际发放券说明为准。配送方式仅限选择配送使用，不能抵扣运费部分。
用户刮券获得的店铺云券可与店铺内领取的店铺易券叠加使用。
店铺云券使用门槛等具体信息以商家在其店铺内的设置使用说明为准。
无敌券可用于单件商品的付款，也可用于购物车合并下单付款，同时支持在跨店铺订单中使用。店铺云券仅可使用在指定店铺中，注：部分店铺活动商品不支持用券，以订单实际提交为准。
云钻刮券获得的无敌券可以购买大聚惠、抢购、团购、手机专享价，但不可购买闪拍、预售、S码、名品特卖、海外购、秒杀、虚拟产品、法律规定限制产品如一段奶粉（包括但不仅限列出的商品）等、云钻加钱兑及云钻全额兑。
在购物时，点击购买后，页面会提示可使用易购券，只要点击选择易购券即可抵用扣除对应金额。云钻刮券获得无敌券或店铺云券使用时可用于抵扣商品金额，不能抵扣运费、运费险、增值服务等非商品金额。
云钻刮券获得的无敌券或店铺云券可与店铺页面领取的店铺易券叠加使用，付款时默认优先使用力度较大的店铺优惠券，如使用店铺易券后的订单金额仍然满足云钻刮券所获得店铺云券使用条件，可继续叠加使用店铺云券。（举例：店铺在页面设置满199减50元的店铺易券，同时用户在店铺刮券获得一张满20元减20元的店铺云券，如商品订单金额为200元，会员在用已使用领取的50元店铺易券情况下，仍然可以使用云钻刮券获得20元店铺云券）
云钻刮券获得的无敌券或店铺云券不得提现，不得转赠他人，不得为他人付，不得拆分使用。
一个订单最多使用6张易购券。
云钻刮券获得的有效期为：自获得之日起7天内有效（部分活动券可能存在不同有效期，具体详见“我的优惠券”内易购券有效期说明）。
在获取和使用券过程中，如果出现违规行为（如作弊领取、恶意套现、刷取信誉、虚假交易等），苏宁将取消用户的中奖资格，并有权撤销违规交易、收回易购券（含已使用的易购券及未使用的易购券）,必要时追究法律责任。
使用易购券的订单若交易未成功或发生退款及售后，在交易所使用的易购券有效期内订单取消完成的，易购券将退回用户账户，退回后的易购券有效期不变。如在使用的易购券有效期之外发生退款，所使用的券退回当天有效，过期不予退还。如发生售后退款，易购券退回当天有效，过期不予退还。

君凤文轩图书专营店

商品参数

作者：肖刚，张良均著著| 肖刚，张良均著编| 肖刚，张良均著译| 肖刚，张良均著绘
出版社：人民邮电出版社
出版时间：2022-01-01
版次：1
印次：1
字数：371000
页数：236
开本：16开
ISBN：9787115566881
版权提供：人民邮电出版社

作者：肖刚，张良均著
著：肖刚，张良均著
装帧：平装
印次：1
定价：59.8
ISBN：9787115566881

出版社：人民邮电出版社
开本：16开
印刷时间：暂无
语种：暂无

出版时间：2022-01-01
页数：236
外部编号：党庄162882
版次：1
成品尺寸：暂无

第1章绪论 1

1.1 自然语言处理概述 1

1.1.1 NLP的发展历程 2

1.1.2 NLP研究内容 3

1.1.3 NLP的几个应用场景 4

1.1.4 NLP与人工智能技术 5

1.1.5 学习NLP的难点 6

1.2 NLP基本流程 6

1.2.1 语料获取 6

1.2.2 语料预处理 7

1.2.3 文本向量化 7

1.2.4 模型构建 7

1.2.5 模型训练 7

1.2.6 模型评价 8

1.3 NLP的开发环境 8

1.3.1 Anaconda安装 8

1.3.2 Anaconda应用介绍 9

小结 14

课后习题 14

第2章语料库 16

2.1 语料库概述 16

2.1.1 语料库简介 16

2.1.2 语料库的用途 17

2.2 语料库的种类与构建原则 17

2.2.1 语料库的种类 17

2.2.2 语料库的构建原则 18

2.3 NLTK 19

2.3.1 NLTK简介 19

2.3.2 安装步骤 19

2.3.3 NLTK中函数的使用 21

2.4 语料库的获取 23

2.4.1 获取NLTK语料库 23

2.4.2 获取网络在线语料库 30

2.5 任务：语料库的构建与应用 32

2.5.1 构建作品集语料库 32

2.5.2 武侠小说语料库分析 33

小结 35

实训 35

实训1 构建语料库 35

实训2 《七剑下天山》语料库分析 36

课后习题 36

第3章正则表达式 38

3.1 正则表达式的概念 38

3.1.1 正则表达式函数 38

3.1.2 正则表达式的元字符 40

3.2 任务：正则表达式的应用 43

3.2.1 《西游记》字符过滤 43

3.2.2 自动提取人名与电话号码 44

3.2.3 提取网页标签信息 45

小结 46

实训 46

实训1 过滤《三国志》中的字符 46

实训2 提取地名与邮编 46

实训3 提取网页标签中的文本 46

课后习题 47

第4章中文分词技术 48

4.1 中文分词简介 48

4.2 基于规则分词 48

4.2.1 正向优选匹配法 49

4.2.2 逆向优选匹配法 49

4.2.3 双向优选匹配法 50

4.3 基于统计分词 51

4.3.1 n元语法模型 51

4.3.2 隐马尔可夫模型相关概念 55

4.4 中文分词工具jieba 62

4.4.1 基本步骤 63

4.4.2 分词模式 63

4.5 任务：中文分词的应用 64

4.5.1 HMM中文分词 64

4.5.2 提取新闻文本中的高频词 68

小结 69

实训 70

实训1 使用HMM进行中文分词 70

实训2 提取文本中的高频词 70

课后习题 70

第5章词性标注与命名实体识别 72

5.1 词性标注 72

5.1.1 词性标注简介 72

5.1.2 词性标注规范 73

5.1.3 jieba词性标注 74

5.2 命名实体识别 77

5.2.1 命名实体识别简介 77

5.2.2 CRF模型 78

5.3 任务：中文命名实体识别 82

5.3.1 sklearn-crfsuite库简介 83

5.3.2 命名实体识别流程 83

小结 90

实训中文命名实体识别 90

课后习题 91

第6章关键词提取 92

6.1 关键词提取技术简介 92

6.2 关键词提取算法 93

6.2.1 TF-IDF算法 93

6.2.2 TextRank算法 94

6.2.3 LSA与LDA算法 96

6.3 任务：自动提取文本关键词 103

小结 109

实训 109

实训1 文本预处理 109

实训2 使用TF-IDF算法提取关键词 109

实训3 使用TextRank算法提取关键词 110

实训4 使用LSA算法提取关键词 110

课后习题 110

第7章文本向量化 112

7.1 文本向量化简介 112

7.2 文本离散表示 113

7.2.1 独热表示 113

7.2.2 BOW模型 113

7.2.3 TF-IDF表示 114

7.3 文本分布式表示 114

7.3.1 Word2Vec模型 114

7.3.2 Doc2Vec模型 118

7.4 任务：文本相似度计算 120

7.4.1 Word2Vec词向量的训练 121

7.4.2 Doc2Vec段落向量的训练 122

7.4.3 计算文本的相似度 124

小结 128

实训 128

实训1 实现基于Word2Vec模型的新闻语料词向量训练 128

实训2 实现基于Doc2Vec模型的新闻语料段落向量训练 128

实训3 使用Word2Vec模型和Doc2Vec模型计算新闻文本的相似度 129

课后习题 129

第8章文本分类与文本聚类 131

8.1 文本挖掘简介 131

8.2 文本分类常用算法 132

8.3 文本聚类常用算法 133

8.4 文本分类与文本聚类的步骤 135

8.5 任务：垃圾短信分类 136

8.6 任务：新闻文本聚类 141

小结 144

实训 144

实训1 基于朴素贝叶斯的新闻分类 144

实训2 食品种类安全问题聚类分析 145

课后习题 145

第9章文本情感分析 147

9.1 文本情感分析简介 147

9.1.1 文本情感分析的主要内容 147

9.1.2 文本情感分析的常见应用 148

9.2 情感分析的常用方法 149

9.2.1 基于情感词典的方法 149

9.2.2 基于文本分类的方法 150

9.2.3 基于LDA主题模型的方法 151

9.3 任务：基于情感词典的情感分析 151

9.4 任务：基于文本分类的情感分析 154

9.4.1 基于朴素贝叶斯分类的情感分析 154

9.4.2 基于SnowNLP库的情感分析 156

9.5 任务：基于LDA主题模型的情感分析 157

9.5.1 数据处理 157

9.5.2 模型训练 158

9.5.3 结果分析 159

小结 160

实训 160

实训1 基于词典的豆瓣评论文本情感分析 160

实训2 基于朴素贝叶斯算法的豆瓣评论文本情感分析 160

实训3 基于SnowNLP的豆瓣评论文本情感分析 161

实训4 基于LDA主题模型的豆瓣评论文本情感分析 161

课后习题 161

第10章 NLP中的深度学习技术 163

10.1 循环神经网络概述 163

10.2 RNN结构 164

10.2.1 多对一结构 164

10.2.2 等长的多对多结构 164

10.2.3 非等长结构（Seq2Seq模型） 169

10.3 深度学习工具 171

10.3.1 TensorFlow简介 171

10.3.2 基于TensorFlow的深度学习库Keras 172

10.4 任务：基于LSTM的文本分类与情感分析 172

10.4.1 文本分类 172

10.4.2 情感分析 181

10.5 任务：基于Seq2Seq的机器翻译 185

10.5.1 语料预处理 185

10.5.2 构建模型 188

10.5.3 定义优化器和损失函数 191

10.5.4 训练模型 191

10.5.5 翻译 194

小结 195

实训 195

实训1 实现基于LSTM模型的新闻分类 195

实训2 实现基于LSTM模型的携程网评论情感分析 196

实训3 实现基于Seq2Seq和GPU的机器翻译 196

课后习题 197

第11章智能问答系统 198

11.1 智能问答系统简介 198

11.2 智能问答系统的主要组成部分 198

11.2.1 问题理解 199

11.2.2 知识检索 199

11.2.3 答案生成 200

11.3 任务：基于Seq2Seq模型的聊天机器人 201

11.3.1 读取语料库 201

11.3.2 文本预处理 202

11.3.3 模型构建 206

11.3.4 模型训练 211

11.3.5 模型评价 218

小结 218

实训基于Seq2Seq模型的聊天机器人 218

课后习题 219

第12章基于TipDM大数据挖掘建模平台实现垃圾短信分类 220

12.1 平台简介 220

12.1.1 实训库 221

12.1.2 数据连接 222

12.1.3 实训数据 222

12.1.4 我的实训 223

12.1.5 系统算法 223

12.1.6 个人算法 225

12.2 实现垃圾短信分类 226

12.2.1 数据源配置 227

12.2.2 文本预处理 229

12.2.3 朴素贝叶斯分类模型 234

小结 235

实训实现基于朴素贝叶斯的新闻分类 235

课后习题 236

肖刚(1968-)，博士，教授。韩山师范学院数学与统计学院院长、广东省中小型企业大数据与智能化工程研究中心主任，华南师范、广州兼职硕士生导师。中国医学装备协会磁共振成像装备与技术专业委员会委员、广东省生物医学工程学会医学信息工程分会委员、广东省工业与应用数学学会、广东省现场统计学会和广东省计算数学学会理事，“泰迪杯”全国数据挖掘挑战赛专家组成员。主要从事应用数学、数据挖掘和医学影像学的研究工作以及创新创业竞赛、数学建模竞赛、数据挖掘挑战赛的教学与指导工作。主持广东省自然科学基金项目2项，主持广东省教育厅项目4项。2016年广东省科学技术进步奖三等奖、2018年汕头科学技术奖一等奖、2019年广东省科学技术进步奖奖以及2019年广东省教学成果（基础教育）一等奖主要成员。张良均。信息系统项目管理师，泰迪杯全国生数据挖掘竞赛（www.tipdm.org）的发起人。华南师范、广东工业兼职教授，广东省工业与应用数学学会理事。兼有高科技企业和高校的工作经历，主要从事大数据挖掘及其应用的策划、研发及咨询培训。全国计算机技术与软件专业技术资格（水平）继续教育和CDA数据分析师培训讲师。发表数据挖掘相关数二十余篇，已取得国家发明专利12项，主编图书《神经网络实用教程》、《数据挖掘:实用案例分析》、《MATLAB数据分析与挖掘实战》等9本图书，主持并完成科技项目9项。获得SAS、SPSS数据挖掘认证及Hadoop开发，具有电力、电信、银行、制造企业、电子商务和电子政务的项目经验和行业背景。

欢迎加入人邮大数据教师服务群：669819871
1.内容契合“1+X”证书制度试点工作中的大数据应用开发（Python）职业技能不错证书考核标准
2.全书与真实案例相结合，方便读者系统学习并动手实践
3.全书紧扣任务需求展开，不堆积知识点，着重于思路的启发与解决方案的实施

查看全部评论>

服务体验

正版新书]Python中文自然语言处理基础与实战肖刚,张良均著978

全店均为全新正版书籍，欢迎选购！新疆西藏青海(可包挂刷).港澳台及海外地区bu bao快递

看了又看

商品预定流程：

预约抢购流程说明：

云钻刮券

刮券规则

云钻刮券活动规则

活动时间

活动形式

其他

券使用规则

苏宁商家

搜索店内商品

商品分类

商品分类

君凤文轩图书专营店

售后保障

最近浏览

猜你喜欢

服务体验

正版新书]Python中文自然语言处理基础与实战肖刚,张良均 著978

全店均为全新正版书籍，欢迎选购！新疆西藏青海(可包挂刷).港澳台及海外地区bu bao快递

看了又看

商品预定流程：

预约抢购流程说明：

云钻刮券

刮券规则

云钻刮券活动规则

活动时间

活动形式

其他

券使用规则

苏宁商家

搜索店内商品

商品分类

商品分类

考试排行榜

君凤文轩图书专营店

售后保障

最近浏览

猜你喜欢

正版新书]Python中文自然语言处理基础与实战肖刚,张良均著978