Spark SQL入门与实践指南

Saved in:
Bibliographic Details
Main Authors: 纪涵 (纪涵,靖晓文,赵政达著); 靖晓文; 赵政达
Published: 清华大学出版社
Publisher Address: 北京
Publication Dates: 2018
Literature type: Book
Language: Chinese
Subjects:
Carrier Form: 200页: ; 26cm
ISBN: 978-7-302-49670-0
Index Number: TP274
CLC: TP274-62
Call Number: TP274-62/2131
Contents: 本书分为4篇,共9章,第一篇讲解了Spark SQL 发展历史和开发环境搭建。第二篇讲解了Spark SQL实例,使得读者掌握Spark SQL的入门操作,了解Spark RDD、DataFrame和DataSet,并熟悉 DataFrame各种操作。第三篇讲解了基于WiFi探针的商业大数据分析项目,实例中包含数据采集、预处理、存储、利用Spark SQL 挖掘数据,一步一步带领读者学习Spark SQL强大的数据挖掘功能。第四篇讲解了Spark SQL 优化的知识。