用Python写网络爬虫 = Python web scraping
Saved in:
Main Authors: | ; |
---|---|
Group Author: | |
Published: |
人民邮电出版社
|
Publisher Address: | 北京 |
Publication Dates: | 2018 |
Literature type: | Book |
Language: | Chinese |
Subjects: | |
Carrier Form: | 196页: ; 24cm |
ISBN: | 978-7-115-47967-9 |
Index Number: | TP311 |
CLC: | TP311.561 |
Call Number: | TP311.561/7229 |
Contents: | 本书讲解了如何使用Python来编写网络爬虫程序,内容包括网络爬虫简介,从页面中抓取数据的3种方法,提取缓存中的数据,使用多个线程和进程进行并发抓取,抓取动态页面中的内容,与表单进行交互,处理页面中的验证码问题,以及使用Scarpy和Portia进行数据抓取,并在最后介绍了使用本书讲解的数据抓取技术对几个真实的网站进行抓取的实例,旨在帮助读者活学活用书中介绍的技术。 |