Spark大数据分析与实战
Saved in:
Corporate Authors: | |
---|---|
Published: |
清华大学出版社
|
Publisher Address: | 北京 |
Publication Dates: | 2019 |
Literature type: | Book |
Language: | Chinese |
Series: |
大数据技术与应用丛书 |
Subjects: | |
Carrier Form: | 10,228页: 图 ; 27cm |
ISBN: | 978-7-302-53432-7 |
Index Number: | TP274 |
CLC: | TP274 |
Call Number: | TP274/6720-1 |
Contents: |
国家软件与集成电路公共服务平台信息技术紧缺人才培养工程指定教材 本书共9章。第1章介绍开发Spark框架的Scala编程语言;第2-4、7-8章讲解Spark核心基础、SparkRDD弹性分布式数据集、SparkSQL处理结构化数据、SparkStreaming实时计算框架、SparkMLlib机器学习库,并包含了搭建Spark集群、Spark集群的操作方式、利用Spark解决大数据工作中遇到的基本问题。第5-6章讲解大数据环境中常见的辅助系统,HBase数据库以及Kafka流处理平台,包含辅助系统的搭建方式、使用方法以及相关底层实现的基本原理;第9章是一个综合项目,利用Spark框架 |