Spark大数据分析实战
Saved in:
Main Authors: | |
---|---|
Published: |
清华大学出版社
|
Publisher Address: | 北京 |
Publication Dates: | 2020 |
Literature type: | Book |
Language: | Chinese |
Subjects: | |
Carrier Form: | 365页: 图 ; 26cm |
ISBN: | 978-7-302-55695-4 |
Index Number: | TP274 |
CLC: | TP274 |
Call Number: | TP274/1223-4 |
Contents: | 全书共9章,第1章讲解Scala语言的基础知识,包括IDEA工具的使用等;第2章讲解Spark的主要组件、集群架构原理、集群环境搭建以及Sark应用程序的提交和运行;第3-9章讲解离线计算框架SparkRDD、Spark SQL和实时计算框架Kafka、Spark Streaming、Structured Streaming以及图计算框架GraphX等的基础知识、架构原理,同时包括常用Shell命令、API操作、内核源码剖析,并通过多个实际案例讲解各个框架的具体应用以及与Hadoop生态系统框架Hie、HBase、Kafka的整合操作。 |