《【正版】 Python文本分析原书第2版迪潘简萨卡尔程序设计数据科学工程技术语法自然语言机器设据程》迪潘简·萨卡尔(Dipanjan著【摘要书评在线阅读】-苏宁易购图书

云钻刮券活动规则

活动时间

活动自2017年6月2日上线，敬请关注云钻刮券活动规则更新。

活动形式

会员打开苏宁易购wap端、PC端、苏宁易购APP端方可参与活动。
活动方式为云钻刮券，每次刮券需要扣除200云钻。奖励分为无敌券和店铺云券两种，100%刮出无敌券，最低2元。店铺券由店铺提供，用户可以根据购物需求，在无敌券和店铺云券之间二选一。如因为网络、用户关闭等原因，造成页面关闭，导致用户没有或无法选择，系统将在5分钟内自动按照获得的无敌券面额发放到用户账户。
每人每天参与刮券次数上限为1次。活动每日限量，如用户参与时已达到活动最高上限，则不能再继续参与，次日可以继续参与。
如会员在刮券时选择了店铺云券，券发至账户后则无法再更改为平台的无敌券；如会员在刮券时选择了平台的无敌券，券发至账户后则无法再更改为店铺云券。
云钻刮券获得的不固定面值的券，会随机获得无敌券：2~2.2元、5元、10元、20元、50元的无敌券或不同面额的店铺云券。
券是否成功发放，可在“我的优惠券”中查询。

其他

如活动受政府机关指令需要停止举办的，或活动遭受严重网络攻击需暂停举办的，或者系统故障导致的其它意外问题，苏宁无需为此承担赔偿或者进行补偿。

券使用规则

不同面额的无敌券有不同的使用门槛，2~2.2元、5元、10元、20元、50元无敌券为无门槛使用，具体以实际发放券说明为准。配送方式仅限选择配送使用，不能抵扣运费部分。
用户刮券获得的店铺云券可与店铺内领取的店铺易券叠加使用。
店铺云券使用门槛等具体信息以商家在其店铺内的设置使用说明为准。
无敌券可用于单件商品的付款，也可用于购物车合并下单付款，同时支持在跨店铺订单中使用。店铺云券仅可使用在指定店铺中，注：部分店铺活动商品不支持用券，以订单实际提交为准。
云钻刮券获得的无敌券可以购买大聚惠、抢购、团购、手机专享价，但不可购买闪拍、预售、S码、名品特卖、海外购、秒杀、虚拟产品、法律规定限制产品如一段奶粉（包括但不仅限列出的商品）等、云钻加钱兑及云钻全额兑。
在购物时，点击购买后，页面会提示可使用易购券，只要点击选择易购券即可抵用扣除对应金额。云钻刮券获得无敌券或店铺云券使用时可用于抵扣商品金额，不能抵扣运费、运费险、增值服务等非商品金额。
云钻刮券获得的无敌券或店铺云券可与店铺页面领取的店铺易券叠加使用，付款时默认优先使用力度较大的店铺优惠券，如使用店铺易券后的订单金额仍然满足云钻刮券所获得店铺云券使用条件，可继续叠加使用店铺云券。（举例：店铺在页面设置满199减50元的店铺易券，同时用户在店铺刮券获得一张满20元减20元的店铺云券，如商品订单金额为200元，会员在用已使用领取的50元店铺易券情况下，仍然可以使用云钻刮券获得20元店铺云券）
云钻刮券获得的无敌券或店铺云券不得提现，不得转赠他人，不得为他人付，不得拆分使用。
一个订单最多使用6张易购券。
云钻刮券获得的有效期为：自获得之日起7天内有效（部分活动券可能存在不同有效期，具体详见“我的优惠券”内易购券有效期说明）。
在获取和使用券过程中，如果出现违规行为（如作弊领取、恶意套现、刷取信誉、虚假交易等），苏宁将取消用户的中奖资格，并有权撤销违规交易、收回易购券（含已使用的易购券及未使用的易购券）,必要时追究法律责任。
使用易购券的订单若交易未成功或发生退款及售后，在交易所使用的易购券有效期内订单取消完成的，易购券将退回用户账户，退回后的易购券有效期不变。如在使用的易购券有效期之外发生退款，所使用的券退回当天有效，过期不予退还。如发生售后退款，易购券退回当天有效，过期不予退还。

粉象优品图书专营店

商品参数

作者：迪潘简·萨卡尔(Dipanjan著
出版社：机械工业出版社
出版时间：2020-09
开本：16开
ISBN：9784589219814
版权提供：机械工业出版社

店铺公告

本店存在书、古旧书、收藏书、二手书等特殊商品，因受采购成本限制,可能高于定价销售，明码标价，介意者勿拍!

1.书籍因稀缺可能导致售价高于定价,图书实际定价参见下方详情内基本信息,请买家看清楚且明确后再拍，避免价格争议!

2.店铺无纸质均开具电子，请联系客服开具电子版

商品基本信息
商品名称：	python文本分析（原书第2版）
作者：	迪潘简·萨卡尔（Dipanjan Sarkar）
市场价：	129.00元
ISBN 号：	9787111666776
出版日期：	2020-09
页数：	441
字数：	千字
出版社：	机械工业出版社

译者序
推荐序
前言
致谢
作者简介
技术审校者简介
第1章自然语言处理基础1
1.1 自然语言2
1.1.1 什么是自然语言2
1.1.2 语言哲学2
1.1.3 语言习得和用法4
1.2 语言学6
1.3 语言句法和结构7
1.3.1 单词9
1.3.2 短语10
1.3.3 从句12
1.3.4 语法13
1.3.5 语序类型学20
1.4 语言语义21
1.4.1 词汇语义关系22
1.4.2 语义网络和模型24
1.4.3 语义表示25
1.5 文本语料库31
1.5.1 文本语料库标注及使用31
1.5.2 流行的语料库32
1.5.3 访问文本语料库33
1.6 自然语言处理38
1.6.1 机器翻译38
1.6.2 语音识别系统39
1.6.3 问答系统39
1.6.4 上下文识别与消解39
1.6.5 文本摘要40
1.6.6 文本分类40
1.7 文本分析40
1.8 机器学习41
1.9 深度学习41
1.10 本章小结42
第2章 Python自然语言处理43
2.1 了解Python43
2.2 Python之禅44
2.3 应用：何时使用Python45
2.4 缺点：何时不用Python47
2.5 Python的实现和版本47
2.6 建立强大的Python环境48
2.6.1 用哪个Python版本48
2.6.2 用哪个操作系统49
2.6.3 集成开发环境49
2.6.4 环境设置50
2.6.5 软件包管理52
2.6.6 虚拟环境53
2.7 Python语法和结构55
2.8 使用文本数据55
2.8.1 字符串文字56
2.8.2 表示字符串57
2.8.3 字符串操作和方法58
2.9 基本的文本处理和分析：综合案例67
2.10 自然语言处理框架70
2.11 本章小结71
第3章处理和理解文本73
3.1 文本预处理和整理74
3.1.1 删除HTML标签74
3.1.2 文本标记解析76
3.1.3 删除重音字符87
3.1.4 扩展缩写词87
3.1.5 删除特殊字符89
3.1.6 大小写转换89
3.1.7 文本校正89
3.1.8 词干提取96
3.1.9 词形还原99
3.1.10 删除停用词100
3.1.11 将以上整合在一起—构建文本规范器101
3.2 理解文本句法和结构102
3.2.1 安装必要的依赖项103
3.2.2 机器学习的重要概念105
3.2.3 词性标注105
3.2.4 浅层解析或分块112
3.2.5 依存关系解析120
3.2.6 成分结构解析123
3.3 本章小结129
第4章用于文本表示的特征工程131
4.1 理解文本数据132
4.2 构建文本语料库132
4.3 预处理文本语料库133
4.4 传统特征工程模型135
4.4.1 词袋模型135
4.4.2 n-gram词袋模型137
4.4.3 TF-IDF模型137
4.4.4 提取新文档的特征143
4.4.5 文档相似度143
4.4.6 主题模型146
4.5 高级特征工程模型149
4.5.1 加载圣经语料库150
4.5.2 Word2Vec模型150
4.5.3 基于Gensim的强大Word2Vec模型163
4.5.4 Word2Vec特征用于机器学习任务165
4.5.5 GloVe模型169
4.5.6 GloVe特征用于机器学习任务170
4.5.7 FastText模型173
4.5.8 FastText特征用于机器学习任务174
4.6 本章小结175
第5章文本分类176
5.1 什么是文本分类177
5.1.1 正式定义177
5.1.2 主要的文本分类类型178
5.2 自动文本分类178
5.2.1 正式定义179
5.2.2 文本分类任务类型180
5.3 文本分类蓝图180
5.4 数据检索182
5.5 数据预处理和规范化183
5.6 构建训练和测试数据集186
5.7 特征工程技术187
5.7.1 传统特征工程模型188
5.7.2 高级特征工程模型188
5.8 分类模型189
5.8.1 多项式朴素贝叶斯190
5.8.2 逻辑回归191
5.8.3 支持向量机193
5.8.4 集成模型194
5.8.5 随机森林195
5.8.6 梯度提升机195
5.9 评估分类模型196
5.10 构建和评估文本分类器199
5.10.1 分类模型的词袋特征200
5.10.2 分类模型的TF-IDF特征202
5.10.3 比较模型性能评估205
5.10.4 分类模型的Word2Vec嵌入205
5.10.5 分类模型的GloVe嵌入207
5.10.6 分类模型的FastText嵌入208
5.10.7 模型调优209
5.10.8 模型性能评估212
5.11 应用217
5.12 本章小结217
第6章文本摘要和主题模型219
6.1 文本摘要和信息提取220
6.1.1 关键短语提取220
6.1.2 主题建模221
6.1.3 自动文档摘要221
6.2 重要概念221
6.3 关键短语提取223
6.3.1 搭配223
6.3.2 基于权重标签的短语提取228
6.4 主题建模231
6.5 研究论文的主题建模232
6.5.1 主要目标232
6.5.2 数据检索233
6.5.3 加载和查看数据集233
6.5.4 基本文本整理234
6.6 Gensim的主题模型235
6.6.1 特征工程的文本表示236
6.6.2 潜在语义索引238
6.6.3 从头开始实现LSI主题模型245
6.6.4 LDA250
6.6.5 MALLET的LDA模型257
6.6.6 LDA调优：查找最佳主题数259
6.6.7 解释主题模型结果263
6.6.8 预测新研究论文的主题266
6.7 Scikit-Learn的主题模型269
6.7.1 特征工程的文本表示270
6.7.2 潜在语义索引270
6.7.3 LDA274
6.7.4 非负矩阵分解276
6.7.5 预测新研究论文的主题279
6.7.6 可视化主题模型280
6.8 自动文档摘要282
6.8.1 文本整理284
6.8.2 特征工程的文本表示285
6.8.3 潜在语义分析285
6.8.4 TextRank288
6.9 本章小结291
第7章文本相似度和聚类293
7.1 基本概念294
7.1.1 信息检索294
7.1.2 特征工程294
7.1.3 相似度度量295
7.1.4 无监督的机器学习算法295
7.2 文本相似度295
7.3 分析词项相似度296
7.3.1 汉明距离297
7.3.2 曼哈顿距离298
7.3.3 欧几里得距离300
7.3.4 莱文斯坦编辑距离300
7.3.5 余弦距离和相似度304
7.4 分析文档相似度307
7.5 构建电影推荐系统308
7.5.1 加载和查看数据集308
7.5.2 文本预处理310
7.5.3 提取TF-IDF特征311
7.5.4 成对文档相似度的余弦相似度311
7.5.5 查找与示例电影最相似的电影312
7.5.6 构建电影推荐系统313
7.5.7 获取流行的电影列表313
7.5.8 成对文档相似度的Okapi BM25排名315
7.6 文档聚类322
7.7 电影聚类323
7.7.1 特征工程324
7.7.2 k-均值聚类324
7.7.3 近邻传播算法329
7.7.4 Ward凝聚层次聚类332
7.8 本章小结335
第8章语义分析336
8.1 语义分析简介337
8.2 探索WordNet337
8.2.1 理解同义词集338
8.2.2 分析词汇的语义关系339
8.3 词义消歧345
8.4 命名实体识别347
8.5 从零开始构建NER标注器353
8.6 使用训练的NER模型构建端到端的NER标注器360
8.7 分析语义表示362
8.7.1 命题逻辑362
8.7.2 一阶逻辑364
8.8 本章小结368
第9章情感分析369
9.1 问题描述370
9.2 安装依赖项370
9.3 获取数据370
9.4 文本预处理与规范化371
9.5 无监督的词典模型372
9.5.1 Bing Liu词典373
9.5.2 MPQA主观词典373
9.5.3 pattern词典374
9.5.4 TextBlob词典374
9.5.5 AFINN词典376
9.5.6 SentiWordNet词典377
9.5.7 VADER词典380
9.6 使用有监督的学习进行情感分类382
9.7 传统的有监督机器学习模型384
9.8 新的有监督深度学习模型386
9.9 高级的有监督深度学习模型392
9.10 分析情感成因399
9.10.1 解释预测模型399
9.10.2 分析主题模型404
9.11 本章小结409
第10章深度学习的前景410
10.1 为什么我们对嵌入痴迷411
10.2 词嵌入模型的趋势412
10.3 通用句子嵌入模型的趋势413
10.4 理解文本分类问题417
10.5 使用通用句子嵌入417
10.5.1 加载依赖417
10.5.2 加载和查看数据集418
10.5.3 构建训练、验证和测试数据集419
10.5.4 基本文本整理419
10.5.5 构建数据接入函数420
10.5.6 使用通用句子编码器构建深度学习模型421
10.5.7 模型训练421
10.5.8 模型评估423
10.6 红利：使用不同的通用句子嵌入进行迁移学习423
10.7 本章小结与展望429

内容简介

本书遵循结构化和综合性的方法，介绍了文本和语言语法、结构和语义的基础概念和高级概念。从自然语言和Python的基础开始，进而学习先进的分析理念和机器学习概念。全面提供了自然语言处理（NLP）和文本分析的主要概念和技术。包含了丰富的真实案例实现技术，例如构建分类新闻文章的文本分类系统,使用主题建模和文本摘要分析app或游戏评论,进行热门电影概要的聚类分析和电影评论的情感分析。介绍了基于Python和流行NLP开源库和文本分析实用工具，如自然语言工具包（nltk）、gensim、scikit-learn、spaCy和Pattern。

商品详情
内容简介

查看全部评论>

服务体验

[正版] Python文本分析原书第2版迪潘简萨卡尔程序设计数据科学工程技术语法自然语言机器学习

机械工业出版社官方正版

看了又看

商品预定流程：

预约抢购流程说明：

云钻刮券

刮券规则

云钻刮券活动规则

活动时间

活动形式

其他

券使用规则

苏宁商家

搜索店内商品

商品分类

商品分类

粉象优品图书专营店

售后保障

最近浏览

猜你喜欢

服务体验

[正版] Python文本分析 原书第2版 迪潘简 萨卡尔 程序设计 数据科学 工程技术 语法 自然语言 机器学习

机械工业出版社官方正版

看了又看

商品预定流程：

预约抢购流程说明：

云钻刮券

刮券规则

云钻刮券活动规则

活动时间

活动形式

其他

券使用规则

苏宁商家

搜索店内商品

商品分类

商品分类

计算机/网络排行榜

粉象优品图书专营店

售后保障

最近浏览

猜你喜欢

[正版] Python文本分析原书第2版迪潘简萨卡尔程序设计数据科学工程技术语法自然语言机器学习