我可怜的爬虫有记忆漏洞。我能做什么?¶见 调试内存泄漏 . 此外,Python有一个内置的内存泄漏问题,在下面描述:ref:topics-leaks-without-leaks。 我怎么能让 Scrapy 消耗更少的记忆?¶请参阅前面的问题。 如何防止由于许多允许的域而导致的内存错误?¶如果你有一只蜘蛛,上面有一长串
另请参阅 StackOverflow 。 注解 记住要禁用 SPIDER_MIDDLEWARES = {
'scrapy.spidermiddlewares.offsite.OffsiteMiddleware': None,
'myproject.middlewares.CustomOffsiteMiddleware': 500,
}
我可以在spider中使用基本的HTTP身份验证吗?¶是的,请参阅:class:~scrapy.downloadermiddlewares.httpauth.HttpAuthMiddleware。 为什么Scrapy用英语而不是我的母语下载页面?¶尝试更改默认值 Accept-Language request header by overriding the 我在哪里可以找到一些零碎项目的例子?¶见 实例 . 我可以在不创建项目的情况下运行蜘蛛吗?¶对。你可以使用 scrapy runspider my_spider.py
有关详细信息,请参阅:command:`runspider`命令。 |
Archiver|手机版|笨鸟自学网 ( 粤ICP备20019910号 )
GMT+8, 2024-11-21 20:47 , Processed in 0.061670 second(s), 17 queries .