笨鸟编程-零基础入门Pyhton教程

 找回密码
 立即注册

请求和响应

发布者: 笨鸟自学网



访问errback函数中的其他数据

在处理请求失败的情况下,您可能会对访问回调函数的参数感兴趣,以便可以根据errback中的参数进一步处理。下面的示例演示如何使用 Failure.request.cb_kwargs ::

def parse(self, response):
    request = scrapy.Request('http://www.example.com/index.html',
                             callback=self.parse_page2,
                             errback=self.errback_page2,
                             cb_kwargs=dict(main_url=response.url))
    yield request

def parse_page2(self, response, main_url):
    pass

def errback_page2(self, failure):
    yield dict(
        main_url=failure.request.cb_kwargs['main_url'],
    )

请求.meta特殊键

这个 Request.meta 属性可以包含任意数据,但有一些特殊的键可以被scrapy及其内置扩展识别。

那些是:

  • bindaddress

  • cookiejar

  • dont_cache

  • dont_merge_cookies

  • dont_obey_robotstxt

  • dont_redirect

  • dont_retry

  • download_fail_on_dataloss

  • download_latency

  • download_maxsize

  • download_timeout

  • ftp_password (见 FTP_PASSWORD 更多信息)

  • ftp_user (见 FTP_USER 更多信息)

  • handle_httpstatus_all

  • handle_httpstatus_list

  • max_retry_times

  • proxy

  • redirect_reasons

  • redirect_urls

  • referrer_policy


上一篇:Feed 导出下一篇:链接提取器

Archiver|手机版|笨鸟自学网 ( 粤ICP备20019910号 )

GMT+8, 2025-1-15 15:26 , Processed in 0.013406 second(s), 17 queries .

© 2001-2020

返回顶部