干净的数据 = Clean data:数据清洗入门与实践

Saved in:
Bibliographic Details
Main Authors: 美 斯夸尔 Squire, Megan (著)
Group Author: 任政委 (译)
Published: 人民邮电出版社
Publisher Address: 北京
Publication Dates: 2016
Literature type: Book
Language: Chinese
Series: 图灵程序设计丛书
Subjects:
Carrier Form: 12,188页: 图 ; 24cm
ISBN: 978-7-115-42047-3
Index Number: TP274
CLC: TP274
Call Number: TP274/4842-3
Contents: 本书主要内容包括:数据清洗在数据科学领域中的重要作用,文件格式、数据类型、字符编码的基本概念,组织和处理数据的电子表格与文本编辑器,各种格式数据的转换方法,解析和清洗网页上的HTML文件的三种策略,提取和清洗PDF文件中数据的方法,检测和清除RDBMS中的坏数据的解决方案,以及使用书中介绍的方法清洗来自Twirer和Stack Overflow的数据。