基本信息

  • 出版社 : 人民邮电出版社有限公司; 第1版 (2020年1月1日)
  • 出版日期 : 2020年1月1日
  • 品牌 : 图灵社区
  • 语言 : 简体中文
  • 文件大小 : 36704 KB
  • 韦世东 (作者)
  • 下载格式:azw3、epub、mobi 

编辑推荐

适读人群 :本书既适合需要储备反爬虫知识的前端工程师和后端工程师阅读,也适合需要储备绕过知识的爬虫工程师、爬虫爱好者以及Python程序员阅读。

【人气推荐】《Python 3 网络爬虫开发实战》作者、微软小冰工程师崔庆才作序,腾讯、马蜂窝工程师倾力推荐。

【干货满满】爬虫工程师不可错过的“****”,内容包括但不限于Cookie 反爬虫、WebSocket 反爬虫、字体反爬虫、WebDriver反爬虫、App 反爬虫、验证码反爬虫。

【反爬虫原理+爬虫实战】从实战出发,印证国内互联网企业内部加密原理,侧重讲解反爬虫的原理以及绕过方法。

【21个反爬虫示例】结合练习平台 Steamboat,帮助读者随时复现书中的 21个爬虫示例,巩固所学知识。

内容简介

本书首先介绍了开发环境的配置,接着讨论了Web网站的构成和页面渲染、动态网页和静态网页对爬虫造成的影响,紧接着详细介绍了信息校验型反爬虫、动态渲染反爬虫、文本混淆反爬虫知识、特征识别反爬虫的原理、实现和绕过,然后概览了App数据爬取的关键和常用的反爬虫手段,最后介绍了常见的编码和加密原理、JavaScript代码混淆知识、前端禁止事件以及与爬虫相关的法律知识和风险点。

作者简介

韦世东,资深爬虫工程师,2019年华为云·云享专家,掘金社区优秀作者,GitChat认证作者,夜幕团队(NightTeam)成员。拥有七年互联网从业经验,擅长反爬虫的设计和绕过技巧。

精彩书评

  本书内容十分详尽,几乎涵盖了市面上所有的反爬虫类型,包括但不限于 Cookie 反爬虫、WebSocket 反爬虫、字体反爬虫、WebDriver 反爬虫、App 反爬虫、验证码反爬虫。书中首先对各类反爬虫技术进行了合理的归类,然后通过剖析多个案例帮助大家理解各类反爬虫技术的原理。另外,书中还针对各类反爬虫给出了对应的绕过和破解方案。这本书干货满满,可以帮助大家全面了解爬虫和反爬虫的各类技术,强烈推荐给大家。
  —— 崔庆才
  微软小冰工程师
  《Python 3 网络爬虫开发实战》作者

  在大数据时代,所有公司都离不开数据,而获取数据非常快的方式就是利用爬虫去爬取。随着爬虫的增多,反爬虫水平也在不断提高。本书作者自己搭建了 21 个示例,深入解析了 CSS 偏移、字体反爬虫、JavaScript 混淆、App 逆向、验证码破解和加密算法等知识,并用详细的代码手把手教你如何实现反爬虫以及如何破解反爬虫,让大家真正做到“知其然,知其所以然”。强烈推荐给每一位想要从事爬虫工作,以及希望提高爬虫技术水平的朋友们。
  —— 陈祥安
  马蜂窝高级工程师

  我见证了作者从一个零基础小白逐渐成长为一名出色的爬虫工程师的过程。相信本书不仅是技术满满的干货集,也是他记录成长历程的诚意之作!
  —— BruceDone
  腾讯后端开发工程师


资源下载付费资源价格2立即支付
支付后请复制提取码进入网盘下载,电子书格式请参考“基本信息”说明, 如未显示下载按钮,请刷新网页或扫码关注公众号联系客服处理。