返回首页
苏宁会员
购物车 0
易付宝 企业采购
手机苏宁

店铺评分5

店铺评分与同行业相比

商品满意度:5分------

服务满意度:5分------

物流满意度:5分------

  • 服务承诺: 正品保障
  • 公司名称:
  • 所 在 地:
  • 客服电话:

全新正版 玩转Python网络爬虫

  • 作者: 黄永祥 著著
  • 出版社: 清华大学出版社
  • 出版时间:2018-08-01 00:00:00
送至
由""直接销售和发货,并提供售后服务 联系客服
加入购物车 购买电子书
服务
企业采购 针对企业客户采购的专业服务

看了又看

商品预定流程:

查看大图
/
×

苏宁商家

商家:
上饶诚哲图书专营店
联系:
联系客服
电话:

17509173691

  • 商品

  • 服务

  • 物流

搜索店内商品

商品分类

商品参数
  • 作者: 黄永祥 著著
  • 出版社:清华大学出版社
  • 出版时间:2018-08-01 00:00:00
  • 版次:1
  • 印次:1
  • 印刷时间:2018-08-01
  • 字数:454千字
  • 页数:311
  • 开本:16开
  • 装帧:平装
  • ISBN:9787302503286
  • 国别/地区:中国
  • 版权提供:清华大学出版社

基本信息

书名:玩转Python网络爬虫

定价:69.00元

作者:黄永祥

出版社:清华大学出版社

出版日期:2018-06-01

ISBN:9787302503286

字数:

页码:

版次:1

装帧:平装-胶订

开本:16开

商品重量:0.4kg

编辑推荐


本书站在初学者的角度,从原理到实践,深入、系统地阐述了使用Python 3开发网络爬虫的核心技术,全书从逻辑上可分为基础篇、实战篇和爬虫框架篇三部分。
基础篇主要介绍了编写网络爬虫所需的基础知识,包括网站分析、数据抓取、数据清洗和数据入库。网站分析讲述如何使用Chrome和Fiddler抓包工具对网站做全面分析。数据抓取介绍了Python爬虫模块Urllib和Requests的基础知识。数据清洗主要介绍字符串操作、正则表达式和Beautiful Soup的使用。数据入库分别讲述了MySQL和MongoDB的操作,通过ORM框架SQLAlchemy实现数据持久化,实现企业级开发。
实战篇深入讲解了分布式爬虫、爬虫软件的开发与应用、12306抢票程序和微博爬取,所举实例均来自于编者的开发实践,可帮助读者快速提升技能,开发自己的实际项目。
爬虫框架篇主要讲述Scrapy的原理和特性,通过爬取音乐实例,介绍Scrapy在网络爬虫中的应用技巧。本部分内容可使读者深入地了解Scrapy的使用,并举一反三,编写出复杂的网络爬虫程序。
本书既介绍编写网络爬虫的各种技术,又注重以网络爬虫和网站分析的思想为出发点,培养读者编写网络爬虫的逻辑思维,使读者能够针对不同的网站制定出不同的爬虫方案;此外,还介绍了反爬虫机制和相应的解决方案,是读者入职爬虫工程师的实践。
本书所有程序代码均在Python 3.5环境下测试通过,读者可从网络上下载本书所有实例源代码。

内容提要


本书站在初学者的角度,从原理到实践,循序渐进地讲述了使用Python开发网络爬虫的核心技术。全书从逻辑上可分为基础篇、实战篇和爬虫框架篇三部分。基础篇主要介绍了编写网络爬虫所需的基础知识,分别是网站分析、数据抓取、数据清洗和数据入库。网站分析讲述如何使用Chrome和Fiddler抓包工具对网络做全面分析;数据抓取介绍了Python爬虫模块Urllib和Requests的基础知识;数据清洗主要介绍字符串操作、正则和Beautiful Soup的使用;数据入库分别讲述了MySQL和MongoDB的操作,通过ORM框架SQLAlchemy实现数据持久化,实现企业级开发。实战篇深入讲解了分布式爬虫、爬虫软件开发与应用、12306抢票程序和微博爬取,所举示例均来自于开发实践,可帮助读者快速提升技能,开发实际项目。框架篇主要讲述Scrapy的基础知识,并通过爬取音乐为实例,让读者深层次了解Scrapy的使用。本书内容丰富,注重实战,适用于从零开始学习网络爬虫的初学者,或者是已经有一些网络爬虫编写经验,但希望更加全面、深入理解Python爬虫的开发人员。

目录


目 录

第1章理解网络爬虫 1

1.1 爬虫的定义 1

1.2 爬虫的类型 2

1.3 爬虫的原理 3

1.4 爬虫的搜索策略 5

1.5 反爬虫技术及解决方案 6

1.6 本章小结 8

第2章爬虫开发基础 9

2.1与S 9

2.2 请求头 11

2.3Cookies 13

2.4HTML 14

2.5 JavaScript16

2.6JSON 18

2.7Ajax 19

2.8 本章小结 20

第3章Chrome分析网站 21

3.1Chrome开发工具 21

3.2Elements标签 22

3.3Network标签 23

3.4 分析音乐 27

3.5 本章小结 29

第4章Fiddler抓包工具 30

4.1Fiddler介绍 30

4.2Fiddler安装配置 31

4.3Fiddler抓取手机应用 33

4.4Toolbar工具栏 36

4.5Web Session列表 37

4.6View选项视图 40

4.7Quickexec命令行 41

4.8 本章小结 42

第5章Urllib数据抓取 43

5.1Urllib简介 43

5.2 发送请求 44

5.3 复杂的请求 46

5.4 代理IP 47

5.5 使用Cookies 48

5.6 证书验证 50

5.7 数据处理 51

5.8 本章小结 52

第6章Requests数据抓取 54

6.1Requests简介及安装 54

6.2 请求方式 55

6.3 复杂的请求方式 57

6.4 下载与上传 60

6.5 本章小结 63

第7章验证码识别 64

7.1 验证码类型 64

7.2OCR技术 66

7.3 第三方平台 69

7.4 本章小结 72

第8章数据清洗 74

8.1 字符串操作 74

8.2 正则表达式 78

8.3Beautiful Soup介绍及安装 84

8.4Beautiful Soup的使用 86

8.5 本章小结 90

第9章文档数据存储 92

9.1CSV数据写入和读取 92

9.2 Excel数据写入和读取 94

9.3Word数据写入和读取 99

9.4 本章小结 101

第10章ORM框架 104

10.1SQLAlchemy介绍 104

10.2安装SQLAlchemy 105

10.3连接数据库 106

10.4创建数据表 108

10.5添加数据 111

10.6更新数据 112

10.7查询数据 114

10.8本章小结 116

第11章MongoDB数据库操作 118

11.1MongoDB介绍 118

11.2安装及使用 120

11.2.1MongoDB 120

11.2.2MongoDB可视化工具 121

11.2.3PyMongo 123

11.3连接数据库 123

11.4添加文档 125

11.5更新文档 126

11.6查询文档 127

11.7本章小结 130

第12章项目实战:爬取商品信息 131

12.1分析说明 131

12.2功能实现 134

12.3数据存储 136

12.4本章小结 138

第13章项目实战:分布式爬虫——音乐 139

13.1分析说明 139

13.2歌曲下载 140

13.3歌手和歌曲信息 145

13.4分类歌手列表 148

13.5全站歌手列表 150

13.6数据存储 152

13.7分布式概念 154

13.7.1GIL是什么 154

13.7.2为什么会有GIL 154

13.8并发库concurrent.futures 155

13.9分布式爬虫 157

13.10本章小结 159

第14章项目实战:爬虫软件——商品信息 161

14.1分析说明 161

14.2GUI库介绍 162

14.3PyQt5安装及环境搭建 162

14.4软件界面开发 165

14.5MVC——视图 169

14.6MVC——控制器 171

14.7MVC——模型 172

14.8扩展思路 173

14.9本章小结 174

第15章项目实战:12306抢票 176

15.1分析说明 176

15.2验证码验证 177

15.3用户登录与验证 181

15.4查询车次 187

15.5预订车票 193

15.6提交订单 196

15.7生成订单 204

15.8本章小结 209

第16章项目实战:玩转微博 219

16.1分析说明 219

16.2用户登录 220

16.3用户登录(带验证码) 232

16.4关键字搜索热门微博 240

16.5发布微博 247

16.6关注用户 253

16.7点赞和转发评论 257

16.8本章小结 263

第17章Scrapy爬虫框架 265

17.1爬虫框架 265

17.2Scrapy的运行机制 267

17.3安装Scrapy 268

17.4爬虫开发快速入门 270

17.5Spiders介绍 277

17.6Spider的编写 278

17.7Items的编写 282

17.8Item Pipeline的编写 284

17.9Selectors的编写 288

17.10文件下载 291

17.11本章小结 296

第18章项目实战:Scrapy爬取音乐 298

18.1分析说明 298

18.2创建项目 299

18.3编写setting 300

18.4编写Items 301

18.5编写Item Pipelines 302

18.6编写Spider 305

18.7本章小结 310

作者介绍


黄永祥,信息管理与信息系统专业学士,曾从事过系统开发和自动化开发,精通B/S和C/S自动化测试技术,多年网络爬虫开发经验,对反爬虫机制有独到的见解,精通Flask、Django等Web框架并有丰富的网站开发经验。曾就职于广州易点科技有限公司,担任Python开发工程师,目前就职于广东数据集成有限公司。热爱分享和新技术的探索,在CSDN上发表多篇Python技术文章。

文摘







序言


售后保障

最近浏览

猜你喜欢

该商品在当前城市正在进行 促销

注:参加抢购将不再享受其他优惠活动

x
您已成功将商品加入收藏夹

查看我的收藏夹

确定

非常抱歉,您前期未参加预订活动,
无法支付尾款哦!

关闭

抱歉,您暂无任性付资格

此时为正式期SUPER会员专享抢购期,普通会员暂不可抢购