CLOSESPIDER_TIMEOUT¶违约: 指定秒数的整数。如果蜘蛛保持打开超过该秒数,它将自动关闭,原因如下 CLOSESPIDER_ITEMCOUNT¶违约: 指定项数的整数。如果爬行器抓取的数量超过该数量,并且这些项通过项管道传递,则爬行器将关闭,原因是 CLOSESPIDER_PAGECOUNT¶违约: 指定要爬网的最大响应数的整数。如果蜘蛛爬得比这个还多,蜘蛛会被关闭的,原因是 CLOSESPIDER_ERRORCOUNT¶违约: 一个整数,指定关闭蜘蛛之前要接收的最大错误数。如果spider生成的错误数量超过该数量,则会关闭它并说明原因。 StatsMailer扩展¶
这个简单的扩展可用于在域完成抓取时发送通知电子邮件,包括收集到的残缺统计信息。电子邮件将发送给 电子邮件可以使用 调试扩展¶堆栈跟踪转储扩展¶
当 SIGQUIT 或 SIGUSR2 接收到信号。转储的信息如下:
在转储堆栈跟踪和引擎状态后, Scrapy 进程继续正常运行。 此扩展仅适用于与POSIX兼容的平台(即,不适用于Windows),因为 SIGQUIT 和 SIGUSR2 Windows上没有信号。 至少有两种方法可以将Scrapy SIGQUIT 信号:
|
Archiver|手机版|笨鸟自学网 ( 粤ICP备20019910号 )
GMT+8, 2024-12-22 12:52 , Processed in 0.023950 second(s), 17 queries .