开启辅助访问

笨鸟编程-零基础入门Pyhton教程 › 首页 ›Scrapy中文手册 › 查看内容

请求和响应

发布者: 笨鸟自学网

访问errback函数中的其他数据¶

在处理请求失败的情况下，您可能会对访问回调函数的参数感兴趣，以便可以根据errback中的参数进一步处理。下面的示例演示如何使用 Failure.request.cb_kwargs ：：

def parse(self, response):
    request = scrapy.Request('http://www.example.com/index.html',
                             callback=self.parse_page2,
                             errback=self.errback_page2,
                             cb_kwargs=dict(main_url=response.url))
    yield request

def parse_page2(self, response, main_url):
    pass

def errback_page2(self, failure):
    yield dict(
        main_url=failure.request.cb_kwargs['main_url'],
    )

请求.meta特殊键¶

这个 Request.meta 属性可以包含任意数据，但有一些特殊的键可以被scrapy及其内置扩展识别。

那些是：

bindaddress
cookiejar
dont_cache
dont_merge_cookies
dont_obey_robotstxt
dont_redirect
dont_retry
download_fail_on_dataloss
download_latency
download_maxsize
download_timeout
ftp_password （见 FTP_PASSWORD 更多信息）
ftp_user （见 FTP_USER 更多信息）
handle_httpstatus_all
handle_httpstatus_list
max_retry_times
proxy
redirect_reasons
redirect_urls
referrer_policy

1 2 3 456 7 8 9 10 ... 12 / 12 页下一页

上一篇：Feed 导出下一篇：链接提取器

Scrapy中文手册

Scrapy一目了然

安装指南

Scrapy 教程

命令行工具

蜘蛛

选择器

项目

项目加载器

Scrapy shell

项目管道

Feed 导出

请求和响应

链接提取器

设置

例外情况

登录

统计数据集合

发送电子邮件

远程登录控制台

常见问题

调试spiders

蜘蛛合约

常用做法

宽爬行

使用浏览器的开发人员工具进行抓取

选择动态加载的内容

调试内存泄漏

下载和处理文件和图像

部署蜘蛛

AutoThrottle 扩展

标杆管理

作业：暂停和恢复爬行

协同程序

asyncio

体系结构概述

下载器中间件

蜘蛛中间件

扩展

核心API

信号

调度程序

条目导出器

Archiver|手机版|笨鸟自学网 ( 粤ICP备20019910号 )

GMT+8, 2025-7-3 14:03 , Processed in 0.020922 second(s), 17 queries .

© 2001-2020

返回顶部