Python爬虫与反爬虫开发从入门到精通
Saved in:
Main Authors: | |
---|---|
Published: |
北京大学出版社
|
Publisher Address: | 北京 |
Publication Dates: | 2021 |
Literature type: | Book |
Language: | Chinese |
Subjects: | |
Carrier Form: | 378页: 图 ; 26cm |
ISBN: | 978-7-301-32269-7 |
Index Number: | TP311 |
CLC: | TP311.561 |
Call Number: | TP311.561/0414-2 |
Contents: | 本书从零开始系统地介绍了Python网络爬虫与反爬虫的开发与实战技能,全书共分为4篇,具体内容安排如下。第1篇: 基础篇 (第1-3章)。系统地讲解了Python爬虫与反爬虫开发环境的搭建、爬虫与反爬虫通用基础知识、Python编程基础。第2篇: 爬虫篇 (第4-8章)。这部分讲解了网络爬虫的相关知识与技能,主要包括网络爬虫快速入门、XPath匹配网页数据、re正则匹配数据、WebSocket数据抓取、Scrapy爬虫框架应用与开发等。第3篇: 反爬虫篇 (第9-16章)。这部分讲解了网络反爬虫的相关知识与技能,主要包括爬虫与反爬虫的区别与认识、反爬-Header信息校验、反爬-IP限制、反爬-动态渲染页面、反爬-文本混淆、反爬-特征识别、反爬-验证码识别、反爬-APP数据抓取等。第4篇: 实战篇 (第17章)。 |