《Python网络爬虫实战》吕云翔，张扬编著著【摘要书评在线阅读】-苏宁易购图书

云钻刮券活动规则

活动时间

活动自2017年6月2日上线，敬请关注云钻刮券活动规则更新。

活动形式

会员打开苏宁易购wap端、PC端、苏宁易购APP端方可参与活动。
活动方式为云钻刮券，每次刮券需要扣除200云钻。奖励分为无敌券和店铺云券两种，100%刮出无敌券，最低2元。店铺券由店铺提供，用户可以根据购物需求，在无敌券和店铺云券之间二选一。如因为网络、用户关闭等原因，造成页面关闭，导致用户没有或无法选择，系统将在5分钟内自动按照获得的无敌券面额发放到用户账户。
每人每天参与刮券次数上限为1次。活动每日限量，如用户参与时已达到活动最高上限，则不能再继续参与，次日可以继续参与。
如会员在刮券时选择了店铺云券，券发至账户后则无法再更改为平台的无敌券；如会员在刮券时选择了平台的无敌券，券发至账户后则无法再更改为店铺云券。
云钻刮券获得的不固定面值的券，会随机获得无敌券：2~2.2元、5元、10元、20元、50元的无敌券或不同面额的店铺云券。
券是否成功发放，可在“我的优惠券”中查询。

其他

如活动受政府机关指令需要停止举办的，或活动遭受严重网络攻击需暂停举办的，或者系统故障导致的其它意外问题，苏宁无需为此承担赔偿或者进行补偿。

券使用规则

不同面额的无敌券有不同的使用门槛，2~2.2元、5元、10元、20元、50元无敌券为无门槛使用，具体以实际发放券说明为准。配送方式仅限选择配送使用，不能抵扣运费部分。
用户刮券获得的店铺云券可与店铺内领取的店铺易券叠加使用。
店铺云券使用门槛等具体信息以商家在其店铺内的设置使用说明为准。
无敌券可用于单件商品的付款，也可用于购物车合并下单付款，同时支持在跨店铺订单中使用。店铺云券仅可使用在指定店铺中，注：部分店铺活动商品不支持用券，以订单实际提交为准。
云钻刮券获得的无敌券可以购买大聚惠、抢购、团购、手机专享价，但不可购买闪拍、预售、S码、名品特卖、海外购、秒杀、虚拟产品、法律规定限制产品如一段奶粉（包括但不仅限列出的商品）等、云钻加钱兑及云钻全额兑。
在购物时，点击购买后，页面会提示可使用易购券，只要点击选择易购券即可抵用扣除对应金额。云钻刮券获得无敌券或店铺云券使用时可用于抵扣商品金额，不能抵扣运费、运费险、增值服务等非商品金额。
云钻刮券获得的无敌券或店铺云券可与店铺页面领取的店铺易券叠加使用，付款时默认优先使用力度较大的店铺优惠券，如使用店铺易券后的订单金额仍然满足云钻刮券所获得店铺云券使用条件，可继续叠加使用店铺云券。（举例：店铺在页面设置满199减50元的店铺易券，同时用户在店铺刮券获得一张满20元减20元的店铺云券，如商品订单金额为200元，会员在用已使用领取的50元店铺易券情况下，仍然可以使用云钻刮券获得20元店铺云券）
云钻刮券获得的无敌券或店铺云券不得提现，不得转赠他人，不得为他人付，不得拆分使用。
一个订单最多使用6张易购券。
云钻刮券获得的有效期为：自获得之日起7天内有效（部分活动券可能存在不同有效期，具体详见“我的优惠券”内易购券有效期说明）。
在获取和使用券过程中，如果出现违规行为（如作弊领取、恶意套现、刷取信誉、虚假交易等），苏宁将取消用户的中奖资格，并有权撤销违规交易、收回易购券（含已使用的易购券及未使用的易购券）,必要时追究法律责任。
使用易购券的订单若交易未成功或发生退款及售后，在交易所使用的易购券有效期内订单取消完成的，易购券将退回用户账户，退回后的易购券有效期不变。如在使用的易购券有效期之外发生退款，所使用的券退回当天有效，过期不予退还。如发生售后退款，易购券退回当天有效，过期不予退还。

美阅书店

商品参数

作者：吕云翔，张扬编著著| 吕云翔，张扬编著编| 吕云翔，张扬编著译| 吕云翔，张扬编著绘
出版社：清华大学出版社
出版时间：2018-07
版次：1
印刷时间：2019-04-01
字数：433000
页数：391
开本：16开
ISBN：9787302515920
版权提供：清华大学出版社

作者：吕云翔，张扬编著
著：吕云翔，张扬编著
装帧：平装
印次：暂无
定价：79.80
ISBN：9787302515920

出版社：清华大学出版社
开本：16开
印刷时间：2019-04-01
语种：中文

出版时间：2018-07
页数：391
外部编号：9504990
版次：1
成品尺寸：暂无

基础篇

第1章Python与网络爬虫

1.1Python语言

1.1.1什么是Python

1.1.2Python的应用现状

1.2Python的安装与开发环境配置

1.2.1在Windows上安装

1.2.2在Ubuntu和Mac OS上安装

1.2.3PyCharm的使用

1.2.4Jupyter Notebook

1.3Python的基本语法

1.3.1数据类型

1.3.2逻辑语句

1.3.3Python中的函数与类

1.3.4如何学习Python

1.4互联网、HTTP与HTML

1.4.1互联网与HTTP协议

1.4.2HTML

1.5HelloSpider

1.5.1第一个爬虫程序

1.5.2对爬虫程序的思考

1.6调研网站

1.6.1网站的robots.txt与Sitemap

1.6.2查看网站所用的技术

1.6.3查看网站所有者的信息

1.6.4使用开发者工具检查网页

1.7本章小结

第2章数据的采集

2.1从抓取开始

2.2正则表达式

2.2.1初识正则表达式

2.2.2正则表达式的简单使用

2.3BeautifulSoup

2.3.1BeautifulSoup的安装与特点

2.3.2BeautifulSoup的基本使用

2.4XPath与lxml

2.4.1XPath

2.4.2lxml与XPath的使用

2.5遍历页面

2.5.1抓取下一个页面

2.5.2完成爬虫程序

2.6使用API

2.6.1API简介

2.6.2API使用示例

2.7本章小结

第3章文件与数据的存储

3.1Python中的文件

3.1.1基本的文件读写

3.1.2序列化

3.2字符串

3.3Python与图片

3.3.1PIL与Pillow

3.3.2Python与OpenCV简介

3.4CSV文件

3.4.1CSV简介

3.4.2CSV的读写

3.5使用数据库

3.5.1使用MySQL

3.5.2使用SQLite3

3.5.3使用SQLAlchemy

3.5.4使用Redis

3.6其他类型的文档

3.7本章小结

进阶篇

第4章JavaScript与动态内容

4.1JavaScript与AJAX技术

4.1.1JavaScript语言

4.1.2AJAX

4.2抓取AJAX数据

4.2.1分析数据

4.2.2提取数据

4.3抓取动态内容

4.3.1动态渲染页面

4.3.2使用Selenium

4.3.3PyV8与Splash

4.4本章小结

第5章表单与模拟登录

5.1表单

5.1.1表单与POST

5.1.2发送表单数据

5.2Cookie

5.2.1什么是Cookie

5.2.2在Python中使用Cookie

5.3模拟登录网站

5.3.1分析网站

5.3.2通过Cookie模拟登录

5.4验证码

5.4.1图片验证码

5.4.2滑动验证

5.5本章小结

第6章数据的进一步处理

6.1Python与文本分析

6.1.1什么是文本分析

6.1.2jieba与SnowNLP

6.1.3NLTK

6.1.4文本的分类与聚类

6.2数据处理与科学计算

6.2.1从MATLAB到Python

6.2.2NumPy

6.2.3Pandas

6.2.4Matplotlib

6.2.5SciPy与SymPy

6.3本章小结

篇

第7章更灵活和更多样的爬虫

7.1更灵活的爬虫——以微信数据的抓取为例

7.1.1用Selenium抓取Web微信信息

7.1.2基于Python的微信API工具

7.2更多样的爬虫

7.2.1PyQuery

7.2.2在线爬虫应用平台

7.2.3使用urllib

7.3对爬虫的部署和管理

7.3.1配置远程主机

7.3.2编写本地爬虫

7.3.3部署爬虫

7.3.4查看运行结果

7.3.5使用爬虫管理框架

7.4本章小结

第8章浏览器模拟与网站测试

8.1关于测试

8.1.1什么是测试

8.1.2什么是TDD

8.2Python的单元测试

8.2.1使用unittest

8.2.2其他方法

8.3使用Python爬虫测试网站

8.4使用Selenium测试

8.4.1Selenium测试常用的网站交互

8.4.2结合Selenium进行单元测试

8.5本章小结

第9章更强大的爬虫

9.1爬虫框架

9.1.1Scrapy是什么

9.1.2Scrapy的安装与入门

9.1.3编写Scrapy爬虫

9.1.4其他爬虫框架

9.2网站反爬虫

9.2.1反爬虫的策略

9.2.2伪装headers

9.2.3使用代理

9.2.4访问频率

9.3多进程与分布式

9.3.1多进程编程与爬虫抓取

9.3.2分布式爬虫

9.4本章小结

实践篇

第10章爬虫实践：网页中的小说和购物评论

10.1网络小说

10.1.1分析网页

10.1.2编写爬虫

10.1.3运行并查看TXT文件

10.2购物评论

10.2.1查看网络数据

10.2.2编写爬虫

10.2.3数据结果与爬虫分析

10.3本章小结

第11章爬虫实践：保存感兴趣的图片

11.1豆瓣网站分析与爬虫设计

11.1.1从需求出发

11.1.2处理登录问题

11.2编写爬虫程序

11.2.1爬虫脚本

11.2.2程序分析

11.3运行并查看结果

11.4本章小结

第12章爬虫实践：网上影评分析

12.1需求分析与爬虫设计

12.1.1网页分析

12.1.2函数设计

12.2编写爬虫

12.2.1编写程序

12.2.2可能的改进

12.3本章小结

第13章爬虫实践：使用爬虫网页

13.1设计抓取程序

13.2运行程序

13.3展示网页

第14章爬虫实践：使用爬虫框架

14.1Gain框架

14.2使用Gain做简单抓取

14.3PySpider框架

14.4使用PySpider进行抓取

附录A

A.1Python中的一些重要概念

A.1.1*args与**kwargs的使用

A.1.2global关键词

A.1.3enumerate枚举

A.1.4迭代器与生成器

A.2Python中的常用模块

A.2.1collections

A.2.2arrow

A.2.3timeit

A.2.4pickle

A.2.5os

A.2.6sys

A.2.7itertools

A.2.8functools

A.2.9threading、queue与multiprocessing

A.3requests库

A.3.1requests基础

A.3.2更多用法

A.4正则表达式

A.4.1什么是正则表达式

A.4.2正则表达式的基础语法

参考文献

本书介绍如何利用Python进行网络爬虫程序的开发，从Python语言的基本特性入手，详细介绍了Python爬虫开发的相关知识，涉及HTTP、HTML、JavaScript、正则表达式、自然语言处理、数据科学等内容。全书共分为14章，包括Python基础知识、网站分析、网页解析、Python文件的读写、Python与数据库、AJAX技术、模拟登录、文本与数据分析、网站测试、Scrapy爬虫框架、爬虫性能等多个主题，内容覆盖网络抓取与爬虫编程中的主要知识和技术，在重视理论基础的前提下从实用性和丰富度出发，结合实例演示了编写爬虫程序的核心流程。本书适合Python语言初学者、网络爬虫技术爱好者、数据分析从业人员以及高等院校计算机科学、软件工程等相关专业的师生阅读。

本书适合Python语言初学者、网络爬虫技术爱好者、数据分析从业人士以及高等院校计算机科学、软件工程等相关专业的师生阅读。

查看全部评论>

服务体验

正版 Python网络爬虫实战吕云翔,张扬编著清华大学出版社 9787

新华书店旗下自营，正版全新

看了又看

商品预定流程：

预约抢购流程说明：

云钻刮券

刮券规则

云钻刮券活动规则

活动时间

活动形式

其他

券使用规则

苏宁商家

搜索店内商品

商品分类

美阅书店

售后保障

最近浏览

猜你喜欢

服务体验

正版 Python网络爬虫实战 吕云翔,张扬编著 清华大学出版社 9787

新华书店旗下自营，正版全新

看了又看

商品预定流程：

预约抢购流程说明：

云钻刮券

刮券规则

云钻刮券活动规则

活动时间

活动形式

其他

券使用规则

苏宁商家

搜索店内商品

商品分类

考试排行榜

美阅书店

售后保障

最近浏览

猜你喜欢

正版 Python网络爬虫实战吕云翔,张扬编著清华大学出版社 9787