Cover is for reference only

Please scan the QR code to borrow online

企业数据湖 = Data lake for enterprises

Saved in:
Bibliographic Details
Main Authors: 印 约翰 John, Tomcy ((印)汤姆斯·约翰(Tomcy John),(印)潘卡·米斯拉(Pankaj Misra)著); 印 米斯拉 Misra, Pankaj
Group Author: 张世武 (译); 李想 (译); 张浩林 (译)
Published: 机械工业出版社
Publisher Address: 北京
Publication Dates: 2019
Literature type: Book
Language: Chinese
Series: 大数据技术丛书
Subjects:
Carrier Form: 21,369页: 图 ; 24cm
ISBN: 978-7-111-61553-8
Index Number: F272
CLC: F272.7
Call Number: F272.7/2144-1
Contents: 本书对数据湖与Lambda架构原理及实践做了精彩的阐述,全书分为三个主要部分。第一部分介绍了数据湖的概念、企业数据湖的重要性,以及Lambda架构的最新进展。第二部分深入研究使用Lambda架构构建数据湖的主要组件,介绍了一些流行的大数据技术,如ApacheHadoop、Spark、Sqoop、Flume和Elasticsearch。第三部分以实际操作的方式展示如何实现一个企业数据湖,并介绍了几个实际的用例,展示了如何将其他外围组件添加到湖中以提高效率。