DOWNLOADER_STATS¶违约: 是否启用下载器统计信息收集。 DOWNLOAD_DELAY¶违约: 下载者从同一网站下载连续页面之前应等待的时间(以秒计)。这可以用来限制爬行速度,以避免对服务器造成太大的冲击。支持十进制数。例子:: DOWNLOAD_DELAY = 0.25 # 250 ms of delay
此设置也受 什么时候? 您还可以通过设置每个蜘蛛更改此设置 DOWNLOAD_HANDLERS¶违约: 包含项目中启用的请求下载器处理程序的dict。见 DOWNLOAD_HANDLERS_BASE¶违约:: {
'data': 'scrapy.core.downloader.handlers.datauri.DataURIDownloadHandler',
'file': 'scrapy.core.downloader.handlers.file.FileDownloadHandler',
'http': 'scrapy.core.downloader.handlers.http.HTTPDownloadHandler',
'https': 'scrapy.core.downloader.handlers.http.HTTPDownloadHandler',
's3': 'scrapy.core.downloader.handlers.s3.S3DownloadHandler',
'ftp': 'scrapy.core.downloader.handlers.ftp.FTPDownloadHandler',
}
包含在scrappy中默认启用的请求下载处理程序的dict。您不应该在项目中修改此设置,请修改 您可以通过分配 DOWNLOAD_HANDLERS = {
'ftp': None,
}
默认的HTTPS处理程序使用HTTP/1.1。要使用HTTP/2,请执行以下操作:
警告 Scrapy中的HTTP/2支持是试验性的,尚未推荐用于生产环境。未来的Scrapy版本可能会引入相关更改,而不会出现弃用期限或警告。 注解 Scrapy的当前HTTP/2实现的已知限制包括:
DOWNLOAD_TIMEOUT¶违约: 下载程序在超时前等待的时间(以秒计)。 注解 可以使用以下方法设置每个蜘蛛的超时 DOWNLOAD_MAXSIZE¶违约: 下载程序将下载的最大响应大小(字节)。 如果要禁用它,请将其设置为0。 注解 此尺寸可通过使用 |
Archiver|手机版|笨鸟自学网 ( 粤ICP备20019910号 )
GMT+8, 2024-11-21 21:35 , Processed in 0.033341 second(s), 17 queries .