爬虫中间件的作用主要有三点:
- 1.处理引擎传递给爬虫的响应
- 2.处理爬虫传递给引擎的请求
- 3.处理爬虫传递给引擎的数据项
通常有默认的爬虫中间件:
#Default
['scrapy.spidermiddlewares.httperror.HttpErrorMiddleware':50
'scrapy.spidermiddlewares.offsite.OffsiteMiddleware':500, #不再允许的域中
'scrapy.spidermiddlewares.referer.RefererMiddleware':700, #网页的referre填充请求标头
'scrapy.spidermiddlewares.urllength.UrlLengthMiddleware':800, #url长度
'scrapy.spidermiddlewares.depth.DepthMiddleware':900 #url深度
]
声明:1. 本站所有资源来源于用户上传和网络,因此不包含技术服务请大家谅解!如有侵权请邮件联系客服!
2. 本站不保证所提供下载的资源的准确性、安全性和完整性,资源仅供下载学习之用!如有链接无法下载、失效或广告,请联系客服处理!
3. 您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容资源!如用于商业或者非法用途,与本站无关,一切后果请用户自负!
2. 本站不保证所提供下载的资源的准确性、安全性和完整性,资源仅供下载学习之用!如有链接无法下载、失效或广告,请联系客服处理!
3. 您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容资源!如用于商业或者非法用途,与本站无关,一切后果请用户自负!