如梦图书专营店
  • 扫码下单

  • 全新正版网络爬虫项目实践9787560664613西安科技大学出版社
    • 作者: 李程文,唐建生,冯欣悦主编著 | 李程文,唐建生,冯欣悦主编编 | 李程文,唐建生,冯欣悦主编译 | 李程文,唐建生,冯欣悦主编绘
    • 出版社: 西安电子科技大学出版社
    • 出版时间:2023-05
    送至
  • 由""直接销售和发货,并提供售后服务
  • 加入购物车 购买电子书
    服务

    看了又看

    商品预定流程:

    查看大图
    /
    ×

    店铺装修中

    商家:
    如梦图书专营店
    联系:
    • 商品

    • 服务

    • 物流

    搜索店内商品

    如梦图书专营店

  • 新春将至,本公司假期时间为:2025年1月23日至2025年2月7日。2月8日订单陆续发货,期间带来不便,敬请谅解!

    商品参数
    • 作者: 李程文,唐建生,冯欣悦主编著| 李程文,唐建生,冯欣悦主编编| 李程文,唐建生,冯欣悦主编译| 李程文,唐建生,冯欣悦主编绘
    • 出版社:西安电子科技大学出版社
    • 出版时间:2023-05
    • 版次:1
    • 字数:277000
    • 页数:192
    • 开本:16开
    • ISBN:9787560664613
    • 国别/地区:中国
    • 版权提供:西安电子科技大学出版社
    • 作者:李程文,唐建生,冯欣悦主编
    • 著:李程文,唐建生,冯欣悦主编
    • 装帧:平装
    • 印次:暂无
    • 定价:30.00
    • ISBN:9787560664613
    • 出版社:西安科技大学出版社
    • 开本:16开
    • 印刷时间:暂无
    • 语种:暂无
    • 出版时间:2023-05
    • 页数:192
    • 外部编号:12835441
    • 版次:1
    • 成品尺寸:暂无

    项目一 网页数据获取

    任务1.1 读书网信息爬取

    1.1.1网页结构分析

    1.1.2第三方库安装

    1.1.3解决爬虫中文乱码的问题

    1.1.4网页数据爬取

    任务1.2 今日头条数据爬取

    1.2.1网页数据爬取

    1.2.2获取搜索结果详情..

    1..解析详情页数据

    1.2.4保存数据

    任务1.3动态渲染页面的信息爬取..

    1.3.1网页结构分析

    第三方库安装.

    搜索关键字

    1.3.4分析页面并翻页

    1.3.5 分析提取商品内容

    1.3.6 保存信息至MongoDB.

    项目二 特殊网页数据获取

    任务2.1数睿思网模拟登录

    2.1.1查找提交入口

    2.1.2查找并获取需要提交的

    表单数据

    2.1.3使用post请求方法登录

    任务2.2古诗词网数据爬取

    2.2.1 Tesseract 引擎的下载和安装

    2.2.2第三方库安装

    2..验码识别

    2.2.4完成登录

    任务.网页代理爬虫文章信息

    ..1网页结构分析

    ..2 使用 Flask + Redis 维护代理池

    爬取索引页内容

    设置代理

    ..5分析详情页内容

    .. 保存数据信息至 MongoDB

    项目三 Scrapy框架爬虫

    任务3.1商品爬取

    3.1.1 创建Serapy项目

    3.1.2商品数据爬取

    3.1.3商品数据处理

    任务3.2登录赶集网

    3.2.1创建爬虫项目

    3.2.2 获取表单HashCode

    3..获取验码

    3.2.4编写代码

    任务3.3失信人信息爬取

    3.3.1创建爬虫项目

    3.3.2定义数据模型

    3.3.3爬取失信人名单

    3.3.4保存失信人名单信息

    3.3.5下载器中间件

    项目四 分布式爬虫

    任务4.1环境搭建

    4.1.1安装VMware虚拟机

    4.1.2安装Linux

    4.1.3虚拟机网络设置

    4.1.4安装Python

    4.1.5安装分布式框架

    4.1.6克隆虚拟机

    4.1.7安装Redis 数据库

    任务4.2某事百科段子爬取

    4.2.1 创建Serapy项目

    4.2.2爬取网页数据

    4..分布式爬取

    任务4.3链家网内容爬取

    4.3.1 创建 Serapy 项目

    4.3.2 爬取网页数据

    4.3.3数据存储

    4.3.4分布式爬取

    参考文献

     

    本书基于实际工作过程,采用任务驱动的方式编写。全书共四个项目,每个项目包含三个任务。教学内容由浅入深,所有的理论知识都通过项目得以贯通。任务从“任务目标—任务描述—任务实施—实践训练”四个环节入手,环环相扣,层层递进,集“教—学—做”于一体,适合教师循序渐进的教学方式和学生的自学方式。每个任务的选择都是从实际工作过程出发,通过实际操作指导学生解决问题,调动学生学习的积极,使学生能较全面掌握不同场景下Python爬取网络数据的方法和技能。除此之外,本书还配有相应的任务素材、源程序和教案、课件、教学大纲、期末试卷及等教学资源,读者可通过西安科技大学出版社官方(http://www.xduph.com)下载。

    本书读者对象为初学编程的自学者、大中专院校的老师和学生、相关培训机构的老师和学员、初中级程序开发人员和程序测试及维护人员。

    售后保障

    最近浏览

    猜你喜欢

    该商品在当前城市正在进行 促销

    注:参加抢购将不再享受其他优惠活动

    x
    您已成功将商品加入收藏夹

    查看我的收藏夹

    确定

    非常抱歉,您前期未参加预订活动,
    无法支付尾款哦!

    关闭

    抱歉,您暂无任性付资格

    此时为正式期SUPER会员专享抢购期,普通会员暂不可抢购