企业数据湖 = Data lake for enterprises
Saved in:
Main Authors: | ; |
---|---|
Group Author: | ; ; |
Published: |
机械工业出版社
|
Publisher Address: | 北京 |
Publication Dates: | 2019 |
Literature type: | Book |
Language: | Chinese |
Series: |
大数据技术丛书 |
Subjects: | |
Carrier Form: | 21,369页: 图 ; 24cm |
ISBN: | 978-7-111-61553-8 |
Index Number: | F272 |
CLC: | F272.7 |
Call Number: | F272.7/2144-1 |
Contents: | 本书对数据湖与Lambda架构原理及实践做了精彩的阐述,全书分为三个主要部分。第一部分介绍了数据湖的概念、企业数据湖的重要性,以及Lambda架构的最新进展。第二部分深入研究使用Lambda架构构建数据湖的主要组件,介绍了一些流行的大数据技术,如ApacheHadoop、Spark、Sqoop、Flume和Elasticsearch。第三部分以实际操作的方式展示如何实现一个企业数据湖,并介绍了几个实际的用例,展示了如何将其他外围组件添加到湖中以提高效率。 |