实战Python网络爬虫
Saved in:
Main Authors: | |
---|---|
Published: |
清华大学出版社
|
Publisher Address: | 北京 |
Publication Dates: | 2019 |
Literature type: | Book |
Language: | Chinese |
Subjects: | |
Carrier Form: | 12,468页: ; 26cm |
ISBN: | 978-7-302-52489-2 |
Index Number: | TP311 |
CLC: | TP311.561 |
Call Number: | TP311.561/4833-4 |
Contents: | 本书从逻辑上可分为基础篇、实战篇和爬虫框架篇三部分。基础篇主要介绍了编写网络爬虫所需的基础知识,包括网站分析、数据抓取、数据清洗和数据入库。实战篇深入讲解了分布式爬虫、爬虫软件的开发、12306抢票程序和微博爬取等。框架篇主要讲述流行的爬虫框架Scrapy,并以Scrapy与Selenium、Splash、Redis结合的项目案例,让读者深层次了解Scrapy的使用。 |