高性能分布式计算系统开发与实现:基于Hadoop、Scalding和Spark = Guide to high performance distributed computing:case studies with Hadoop, Scalding and Spark

Saved in:
Bibliographic Details
Main Authors: 印 斯里尼瓦沙 Srinivasa, K. G ((印)K.G. 斯里尼瓦沙(K.G. Srinivasa),(印)阿尼尔·库马尔·穆帕拉(Anil Kumar Muppalla)著); 印 穆帕拉 Muppalla, Anil Kumar
Group Author: 高辉 (译); 李东升 (译); 王宏志 (译)
Published: 机械工业出版社
Publisher Address: 北京
Publication Dates: 2018
Literature type: Book
Language: Chinese
Series: 数据科学与工程技术丛书
Subjects:
Carrier Form: 10,234页: ; 26cm
ISBN: 978-7-111-60153-1
Index Number: TP274
CLC: TP274
Call Number: TP274/4867-1
Contents: 华章IT
本书介绍了如何使用开源工具和技术开发与实现大规模分布式处理系统,涵盖构建高性能分布式计算系统的方法和最佳实践。第 一部分(第1-4章)介绍了高性能分布式计算编程的基础知识,包括分布式系统、Hadoop入门、Spark入门、Scalding入门等;第二部分(第5-8章)给出了使用Hadoop、Spark、Scalding的案例研究,涉及数据聚类、数据分类、回归分析、推荐系统等。