Scrapy Shell¶而 幸运的是, from scrapy.shell import inspect_response
def parse_details(self, response, item=None):
if item:
# populate more `item` fields
return item
else:
inspect_response(response, self)
参见: 从spiders调用shell来检查响应 . 在浏览器中打开¶有时,您只想查看某个响应在浏览器中的外观,可以使用 from scrapy.utils.response import open_in_browser
def parse_details(self, response):
if "item name" not in response.body:
open_in_browser(response)
登录¶日志记录是获取蜘蛛运行信息的另一个有用选项。尽管不太方便,但它的优点是,如果需要,日志在将来的所有运行中都将可用: def parse_details(self, response, item=None):
if item:
# populate more `item` fields
return item
else:
self.logger.warning('No item received for %s', response.url)
有关详细信息,请检查 登录 部分。 |
Archiver|手机版|笨鸟自学网 ( 粤ICP备20019910号 )
GMT+8, 2024-12-27 06:03 , Processed in 0.018055 second(s), 17 queries .