高性能分布式计算系统开发与实现:基于Hadoop、Scalding和Spark = Guide to high performance distributed computing:case studies with Hadoop, Scalding and Spark
Saved in:
Main Authors: | ; |
---|---|
Group Author: | ; ; |
Published: |
机械工业出版社
|
Publisher Address: | 北京 |
Publication Dates: | 2018 |
Literature type: | Book |
Language: | Chinese |
Series: |
数据科学与工程技术丛书 |
Subjects: | |
Carrier Form: | 10,234页: ; 26cm |
ISBN: | 978-7-111-60153-1 |
Index Number: | TP274 |
CLC: | TP274 |
Call Number: | TP274/4867-1 |
Contents: |
华章IT 本书介绍了如何使用开源工具和技术开发与实现大规模分布式处理系统,涵盖构建高性能分布式计算系统的方法和最佳实践。第 一部分(第1-4章)介绍了高性能分布式计算编程的基础知识,包括分布式系统、Hadoop入门、Spark入门、Scalding入门等;第二部分(第5-8章)给出了使用Hadoop、Spark、Scalding的案例研究,涉及数据聚类、数据分类、回归分析、推荐系统等。 |