- url¶
包含此请求的URL的字符串。请记住,此属性包含转义的URL,因此它可以不同于 __init__ 方法。 此属性是只读的。要更改请求的URL,请使用 replace() .
- method¶
表示请求中HTTP方法的字符串。这保证是大写的。例子: "GET" , "POST" , "PUT" 等
包含请求头的类似字典的对象。
- body¶
以字节表示的请求正文。 此属性是只读的。要更改请求正文,请使用 replace() .
- meta¶
包含此请求的任意元数据的dict。对于新请求,此dict是空的,通常由不同的零碎组件(扩展、中间产品等)填充。所以这个dict中包含的数据取决于您启用的扩展名。 见 请求.meta特殊键 获取scrapy识别的特殊元键列表。 这个字典是 shallow copied 当使用 copy() 或 replace() 方法,也可以通过 response.meta 属性。
- cb_kwargs¶
包含此请求的任意元数据的字典。它的内容将作为关键字参数传递给请求的回调。对于新请求,它为空,这意味着默认情况下,回调只获取 Response 对象作为参数。 这个字典是 shallow copied 当使用 copy() 或 replace() 方法,也可以通过 response.cb_kwargs 属性。 在处理请求失败的情况下,此dict可以作为 failure.request.cb_kwargs 在请求的errback中。有关详细信息,请参阅 访问errback函数中的其他数据 .
- attributes: Tuple[str, ...]= ('url', 'callback', 'method', 'headers', 'body', 'cookies', 'meta', 'encoding', 'priority', 'dont_filter', 'errback', 'flags', 'cb_kwargs')¶
的元组 str 对象,这些对象包含类的所有公共属性的名称,这些属性也是 __init__ 方法。 当前由以下人员使用 Request.replace() , Request.to_dict() 和 request_from_dict() 。
- copy()[源代码]¶
返回一个新请求,它是此请求的副本。参见: 向回调函数传递附加数据 .
- replace([url, method, headers, body, cookies, meta, flags, encoding, priority, dont_filter, callback, errback, cb_kwargs])[源代码]¶
返回具有相同成员的请求对象,除了那些通过指定的关键字参数赋予新值的成员。这个 Request.cb_kwargs 和 Request.meta 默认情况下,属性被浅复制(除非新值作为参数提供)。另请参见 向回调函数传递附加数据 .
- classmethodfrom_curl(curl_command: str, ignore_unknown_options: bool = True, **kwargs)→ scrapy.http.request.RequestTypeVar[源代码]¶
从包含 cURL 命令。它填充HTTP方法、URL、头、cookies和主体。它接受与 Request 类,获取首选项并重写cURL命令中包含的相同参数的值。 默认情况下,将忽略无法识别的选项。若要在查找未知选项时引发错误,请通过传递调用此方法 ignore_unknown_options=False . 警告 使用 from_curl() 从 Request 子类,例如 JSONRequest 或 XmlRpcRequest ,以及 downloader middlewares 和 spider middlewares 启用,例如 DefaultHeadersMiddleware , UserAgentMiddleware 或 HttpCompressionMiddleware ,可以修改 Request 对象。 要将cURL命令转换为Scrapy请求,可以使用 curl2scrapy .
- to_dict(*, spider: Optional[scrapy.spiders.Spider] = None)→ dict[源代码]¶
返回包含请求数据的字典。 使用 request_from_dict() 要将其转换回 Request 对象。 如果给定了爬行器,此方法将尝试找出用作回调和错误回调的爬行器方法的名称,并将它们包括在输出字典中,如果找不到它们,则引发异常。
|