基本信息

  • 出版社 : 人民邮电出版社有限公司; 第1版 (2020年1月1日)
  • 出版日期 : 2020年1月1日
  • 品牌 : 图灵社区
  • 语言 : 简体中文
  • 文件大小 : 6724 KB
  • 纸书页数 : 189页
  • 特德·马拉斯卡 (作者), 乔纳森·塞德曼 (作者)
  • 下载格式:azw3、epub、mobi 、pdf

编辑推荐

许多公司会在大数据项目的实施细节上下很多功夫,例如研究分布式处理引擎和数据分析算法。这并没有错,但不要因为一棵树而错过整片森林。本书将为你打开更广阔的视野,展示如何从大数据项目的规划阶段开始,一步步走向成功。无论是首席信息官、首席技术官、项目经理,还是架构师和开发人员,都能通过本书得到启迪。

– 开始规划:思考大数据项目的主要类型
– 评估和选择数据管理解决方案
– 降低与技术、团队、需求相关的风险
– 探索良好的接口设计模式
– 为项目选择合适的分布式存储系统
– 规划和实施元数据收集
– 使用数据管道确保数据完整性
– 根据并行处理引擎的特征评估处理框架

内容简介

本书提供了一个框架,从整体上介绍与大数据项目开发相关的基本概念,帮助读者评估大数据项目,理解成功的现代数据项目的基本要素。全书共8章,内容包括现代数据项目的主要类型、生命周期、风险管理、接口设计、分布式存储系统、元数据管理、数据处理等。本书旨在让读者厘清思路,顺利地从数据项目的规划阶段走到执行阶段,实现健壮、可维护的架构和解决方案。

作者简介

特德·马拉斯卡(Ted Malaska),Capital One的企业架构主管,曾在暴雪娱乐公司担任全球视野工程总监,负责为《魔兽世界》《守望先锋》《炉石传说》等游戏提供支持。他为众多开源项目贡献过代码,并与塞德曼等人合著有《Hadoop应用架构》。

乔纳森·塞德曼(Jonathan Seidman),Cloudera云计算团队的软件工程师。在加入Cloudera之前,他是Orbitz Worldwide大数据团队的技术负责人,负责为一个流量巨大的网站管理Hadoop集群。塞德曼与马拉斯卡等人合著有《Hadoop应用架构》。

【译者介绍】
薛命灯,InfoQ高级社区编辑,毕业于厦门大学软件学院,拥有十余年软件开发和架构经验,曾在多家大型软件公司任职,另译有《Kafka**指南》等技术图书。


资源下载付费资源价格2立即支付
支付后请复制提取码进入网盘下载,电子书格式请参考“基本信息”说明, 如未显示下载按钮,请刷新网页或扫码关注公众号联系客服处理。