基本信息
- 出版社 : 人民邮电出版社; 第1版 (2018年3月9日)
- 出版日期 : 2018年3月9日
- 品牌 : 异步图书
- 语言 : 简体中文
- 文件大小 : 39839 KB
- 纸书页数 : 1169页
- 贾沃斯基 (作者), 莱德 (作者), 迪米特里奥斯 (作者), 考奇斯·劳卡斯 (作者), 乔普拉 (作者), 乔希 (作者), 摩突罗 (作者)
- 下载格式:azw3、epub、mobi
编辑推荐
Python是一门动态编程语言,它简单而又强大,适用于众多领域。尽管编写Python代码比较容易,但是编写高效且易于维护和复用的代码是一个挑战。
本书的重点是让你熟悉zui佳实践、有用的工具以及标准,这都是Python专业人士每天使用的。首先,你将了解Python 3.5中新增加的功能以及可以提高生产力的快速技巧。接下来,你将学习使用这个新版本中的高-级且有用的Python语法元素,以及实现元编程的不同方法。本书讲解了代码管理工具、编写清晰文档的方法和测试驱动开发,这些都是编写代码的重要因素。通过学习优化的一般原则、查找瓶颈的策略以及应用优化的选定工具,你可以对如何编写高效的代码有更深入的理解。
读完本书后,你会成为一名可以编写高效且可维护代码的专家。
通过阅读本书,你将能够:
了解在Python社区中广泛采用的约定和zui佳实践;
高效打包Python代码,以便将其应用于社区和生产;
应用在远程系统上自动化部署代码的简单且轻量的方法;
提高代码的质量、可靠性及性能;
在Python中编写并发代码;
使用其他语言编写的代码来扩展Python。Scrapy是一个开源的Python爬虫框架,可以用来轻松提取从页面数据。Scrapy带有丰富的特性,可通过简单的编码或配置来访问,从而可以节省开发人员数周的开发时间,并高效地提取所需数据。Scrapy有一个高度活跃且迅速增长的社区,而且已经成为黑客、创业者和Web爬取专家的首 选框架。
本书讲解了Scrapy的基础知识,讨论了如何从任意源提取数据,如何清理数据,以及如何使用Python和第三方API进行处理,以满足自身需求。本书还讲解了如何将爬取的数据高效地馈入数据库、搜索引擎和流数据处理系统(比如Apache Spark)。在学习完本书后,你将对数据爬取胸有成竹,并将数据应用在自己的应用程序中。
本书内容:
使用HTML和Xpath提取所需的数据;
使用Python编写Scrapy爬虫,并在网络上进行爬取操作;
将数据推送到任意数据库、搜搜引擎或分析系统的方法;
配置爬虫,使其下载文件和图形,以及使用代理;
创建用来限流数据的高效管道;
使用Twitsted实践驱动的API并发处理数百个Item;
让爬虫更快速,让内存使用率更高,以及对Scrapy性能进行调优的技巧;
使用Scrapyd和Scrapinghub执行大规模分布式爬取操作的方法。
自然语言处理(NLP)是有关计算语言学与人工智能的研究领域之一。NLP主要关注人机交互,它提供了计算机和人类之间的无缝交互,使得计算机在机器学习的帮助下理解人类语言。
本书详细介绍如何使用Python执行各种自然语言处理(NLP)任务,并帮助读者掌握利用Python设计和构建基于NLP的应用的zui佳实践。本书引导读者应用机器学习工具来开发各种各样的模型。对于训练数据的创建和主要NLP应用的实现,例如命名实体识别、问答系统、语篇分析、词义消歧、信息检索、情感分析、文本摘要以及指代消解等,本书都进行了清晰的介绍。本书有助于读者使用NLTK创建NLP项目并成为相关领域的专家。
通过阅读本书,你将能够:
● 实现字符串匹配算法以及标准化技术;
● 实现统计语言建模技术;
● 深刻理解词干提取器、词形还原器、形态分析器以及形态生成器的开发;
● 开发搜索引擎并实现词性标注和统计建模(包含n-gram方法)等相关概念;
● 熟悉诸如树型库建设、CFG建设、CYK以及Earley线图解析算法等相关概念;
● 开发基于NER的系统并理解和应用情感分析的相关概念;
● 理解并实现信息检索和文本摘要等相关概念;
● 开发语篇分析系统以及基于指代消解的系统。
内容简介
Python作为一种高-级程序设计语言,凭借其简洁、易读及可扩展性日渐成为程序设计领域备受推崇的语言之一。
本书基于Python 3.5版本进行讲解,通过13章的内容,深度揭示了Python编程的高-级技巧。本书从Python语言及其社区的现状开始介绍,对Python语法、命名规则、Python包的编写、部署代码、扩展程序开发、管理代码、文档编写、测试开发、代码优化、并发编程、设计模式等重要话题进行了全面系统化的讲解。
本书适合想要进一步提高自身Python编程技能的读者阅读,也适合对Python编程感兴趣的读者参考学习。全书结合典型且实用的开发案例,可以帮助读者创建高性能的、可靠且可维护的Python应用。
Scrapy是使用Python开发的一个快速、高层次的屏幕抓取和Web抓取框架,用于抓Web站点并从页面中提取结构化的数据。《精通Python爬虫框架Scrapy》以Scrapy 1.0版本为基础,讲解了Scrapy的基础知识,以及如何使用Python和三方API提取、整理数据,以满足自己的需求。
本书共11章,其内容涵盖了Scrapy基础知识,理解HTML和XPath,安装Scrapy并爬取一个网站,使用爬虫填充数据库并输出到移动应用中,爬虫的强大功能,将爬虫部署到Scrapinghub云服务器,Scrapy的配置与管理,Scrapy编程,管道秘诀,理解Scrapy性能,使用Scrapyd与实时分析进行分布式爬取。本书附录还提供了各种软件的安装与故障排除等内容。
本书适合软件开发人员、数据科学家,以及对自然语言处理和机器学习感兴趣的人阅读。
自然语言处理是计算语言学和人工智能之中与人机交互相关的领域之一。
本书是学习自然语言处理的一本综合学习指南,介绍了如何用Python实现各种NLP任务,以帮助读者创建基于真实生活应用的项目。全书共10章,分别涉及字符串操作、统计语言建模、形态学、词性标注、语法解析、语义分析、情感分析、信息检索、语篇分析和NLP系统评估等主题。
本书适合熟悉Python语言并对自然语言处理开发有一定了解和兴趣的读者阅读参考。
作者简介
Micha? Jaworski有着7年Python编程的经验。他还是graceful的创建者,这是一个构建于falcon之上的REST框架。他曾在不同的公司担任过多种角色,从一名普通的全栈开发人员到软件架构师再到一家快节奏创业公司的工程副总裁。他目前是Opera软件公司TV Store(电视应用商店)团队的首-席后端工程师。他在设计高性能的分布式服务方面拥有丰富的经验。他还是一些流行的Python开源项目的活跃贡献者。
Tarek Ziade?是Mozilla的工程经理,与一个专门用Python为Firefox构建大规模Web应用的团队合作。他对Python打包做出过贡献,而且从早期Zope开始就使用过各种不同的Python Web框架。
Tarek还创建了Afpy——法国的Python用户组,并且用法语写过两本关于Python的书。他还在诸如Solutions Linux、PyCon、OSCON和EuroPython等国际活动中做过多次法语演讲和教学。
Dimitrios Kouzis-Loukas作为一位软件开发人员,已经拥有超过15年的经验。同时,他还使用自己掌握的知识和技能,向广大读者讲授如何编写软件。
他学习并掌握了多门学科,包括数学、物理学以及微电子学。他对这些学科的透彻理解,提高了自身的标准,而不只是“实用的解决方案”。他知道真正的解决方案应当是像物理学规律一样确定,像ECC内存一样健壮,像数学一样通用。
Dimitrios目前正在使用新的数据中心技术开发低延迟、高可用的分布式系统。他是语言无关论者,不过对Python、C++和Java略有偏好。他对开源软硬件有着坚定的信念,他希望他的贡献能够造福于各个社区和全人类。
关于译者
李斌,毕业于北京科技大学计算机科学与技术专业,获得硕士学位。曾任职于阿里巴巴,当前供职于凡普金科,负责应用安全工作。热爱Python编程和Web安全,希望以更加智能和自动化的方式提升网络安全。对自然语言处理理论和算法感兴趣的读者,Python程序员对自然语言处理理论和算法感兴趣的读者,Python程序员对自然语言处理理论和算法感兴趣的读者,Python程序员