基本信息
- 出版社 : 人民邮电出版社有限公司; 第1版 (2020年1月1日)
- 出版日期 : 2020年1月1日
- 品牌 : 图灵社区
- 语言 : 简体中文
- 文件大小 : 6724 KB
- 纸书页数 : 189页
- 特德·马拉斯卡 (作者), 乔纳森·塞德曼 (作者)
- 下载格式:azw3、epub、mobi 、pdf
编辑推荐
许多公司会在大数据项目的实施细节上下很多功夫,例如研究分布式处理引擎和数据分析算法。这并没有错,但不要因为一棵树而错过整片森林。本书将为你打开更广阔的视野,展示如何从大数据项目的规划阶段开始,一步步走向成功。无论是首席信息官、首席技术官、项目经理,还是架构师和开发人员,都能通过本书得到启迪。
– 开始规划:思考大数据项目的主要类型
– 评估和选择数据管理解决方案
– 降低与技术、团队、需求相关的风险
– 探索良好的接口设计模式
– 为项目选择合适的分布式存储系统
– 规划和实施元数据收集
– 使用数据管道确保数据完整性
– 根据并行处理引擎的特征评估处理框架
内容简介
本书提供了一个框架,从整体上介绍与大数据项目开发相关的基本概念,帮助读者评估大数据项目,理解成功的现代数据项目的基本要素。全书共8章,内容包括现代数据项目的主要类型、生命周期、风险管理、接口设计、分布式存储系统、元数据管理、数据处理等。本书旨在让读者厘清思路,顺利地从数据项目的规划阶段走到执行阶段,实现健壮、可维护的架构和解决方案。
作者简介
特德·马拉斯卡(Ted Malaska),Capital One的企业架构主管,曾在暴雪娱乐公司担任全球视野工程总监,负责为《魔兽世界》《守望先锋》《炉石传说》等游戏提供支持。他为众多开源项目贡献过代码,并与塞德曼等人合著有《Hadoop应用架构》。
乔纳森·塞德曼(Jonathan Seidman),Cloudera云计算团队的软件工程师。在加入Cloudera之前,他是Orbitz Worldwide大数据团队的技术负责人,负责为一个流量巨大的网站管理Hadoop集群。塞德曼与马拉斯卡等人合著有《Hadoop应用架构》。
【译者介绍】
薛命灯,InfoQ高级社区编辑,毕业于厦门大学软件学院,拥有十余年软件开发和架构经验,曾在多家大型软件公司任职,另译有《Kafka**指南》等技术图书。