SPIDER_LOADER_CLASS¶违约: 将用于加载spider的类,该类必须实现 SpiderLoader API . SPIDER_LOADER_WARN_ONLY¶违约: 默认情况下,当Scrapy试图从 注解 一些 scrapy commands 使用此设置运行到 SPIDER_MIDDLEWARES¶违约:: 包含项目中启用的蜘蛛中间件及其订单的dict。有关详细信息,请参阅 激活蜘蛛中间件 . SPIDER_MIDDLEWARES_BASE¶违约:: {
'scrapy.spidermiddlewares.httperror.HttpErrorMiddleware': 50,
'scrapy.spidermiddlewares.offsite.OffsiteMiddleware': 500,
'scrapy.spidermiddlewares.referer.RefererMiddleware': 700,
'scrapy.spidermiddlewares.urllength.UrlLengthMiddleware': 800,
'scrapy.spidermiddlewares.depth.DepthMiddleware': 900,
}
包含spider中间件的dict,默认情况下在scrappy中启用,以及它们的顺序。低阶更接近发动机,高阶更接近蜘蛛。有关详细信息,请参阅 激活蜘蛛中间件 . SPIDER_MODULES¶违约: Scrapy将在其中查找蜘蛛的模块列表。 例子:: SPIDER_MODULES = ['mybot.spiders_prod', 'mybot.spiders_dev']
STATS_CLASS¶违约: 用于收集统计信息的类,必须实现 统计收集器API . STATS_DUMP¶违约: 转储 Scrapy stats (对着残破的木头)一旦蜘蛛完成。 有关详细信息,请参阅: 统计数据集合 . STATSMAILER_RCPTS¶违约: 蜘蛛完成爬取后发送残缺数据。见 |
Archiver|手机版|笨鸟自学网 ( 粤ICP备20019910号 )
GMT+8, 2024-11-22 06:34 , Processed in 0.019154 second(s), 17 queries .