基本信息
- 出版社 : 机械工业出版社; 第1版 (2017年3月17日)
- 出版日期 : 2017年2月1日
- 品牌 : 北京华章图文信息有限公司
- 语言 : 简体中文
- 文件大小 : 13267 KB
- 纸书页数 : 294页
- 韦玮 (作者)
- 下载格式:azw3、epub、mobi
编辑推荐
从技术、工具、实战3个维度讲透Python网络爬虫各项核心技术和主流框架,深度讲解网络爬虫的抓取技术与反爬攻关技巧
内容简介
随着大数据时代的到来,我们经常需要在海量数据的互联网环境中搜集一些特定的数据并对其进行分析,我们可以使用网络爬虫对这些特定的数据进行爬取,并对一些无关的数据进行过滤,将目标数据筛选出来。对特定的数据进行爬取的爬虫,我们将其称为聚焦网络爬虫。在大数据时代,聚焦网络爬虫的应用需求越来越大。本书从系统化的视角,为那些想学习Python网络爬虫或者正在研究Python网络爬虫的朋友们提供了一个全面的参考,让读者可以系统地学习Python网络爬虫的方方面面,在理解并掌握了本书的实例之后,能够独立编写出自己的Python网络爬虫项目,并且能够胜任Python网络爬虫工程师相关岗位的工作。
作者简介
韦玮,资深网络爬虫技术专家、大数据专家和软件开发工程师,从事大型软件开发与技术服务多年,现任重庆韬翔网络科技有限公司创始人兼CEO,国家专利发明人。
精通Python技术,在Python网络爬虫、Python机器学习、Python数据分析与挖掘、Python Web开发等多个领域都有丰富的实战经验。
CSDN、51CTO、天善智能等科技类社区和媒体的特邀专家和讲师,输出了大量的高质量课程和文章,深受用户喜爱。
媒体评论
网络爬虫是互联网上进行信息采集的通用手段,在互联网的各个专业方向上都是不可或缺的底层技术支撑。本书从爬虫基础开始,全面阐述了Python网络爬虫技术,并且包含各种经典的网络爬虫项目案例,特别是详细给出了基于Scapy框架实现网络爬虫的*佳实践方案与流程,实战性非常强,是一本关于Python网络爬虫的优秀实战书籍,值得推荐。
——诸葛建伟 清华大学副研究员/《Metasploit渗透测试魔鬼训练营》作者
本书详细讲解了如何基于Python从零开始构建一个成熟的网络爬虫解决方案的完整过程,以及业界主流爬虫技术的原理与实战案例,同时也引入了作者个人的经验与思考,非常有价值。本书循序渐进的内容组织结构,相信无论是新手还是老手,均能很好地阅读和吸收。
——刘天斯 腾讯高级工程师,《Python自动化运维》作者
网络爬虫是许多大数据分析场景的基本需求,实现爬虫程序的基本功能很简单,但是要做到自动化不间断抓取,涉及很多技术和技巧。难能可贵的是,本书将网络爬虫编程的技术和实践技巧无私地总结并分享了出来。另外,Python也是运维人的*爱,Python入门容易精通难,通过阅读本书,可以深度学习如何在一个具体场景中使用Python。
——肖力 云技术社区创始人
Python广泛应用于网络爬虫,本书循序渐进地阐述了爬虫的理论知识和核心技术,以丰富的实例讲解了网络爬虫的实战应用,精心组织的代码完美地诠释了爬虫的核心要义。这本书非常值得每一个对爬虫感兴趣的读者细细研读。
——谢佳标 乐逗游戏高级数据分析师/《R语言游戏数据分析》作者