笨鸟编程-零基础入门Pyhton教程

 找回密码
 立即注册

Feed 导出

发布者: 笨鸟自学网



ItemFilter

后处理

VERSION 新版功能.

Scrapy提供了一个选项来激活插件,以便在将其导出到Feed存储之前对其进行后期处理。除了使用 builtin plugins ,您可以创建自己的 plugins 

这些插件可以通过 postprocessing 馈送的选项。必须按照您希望处理提要的顺序向该选项传递一个后处理插件列表。这些插件可以声明为导入字符串,也可以使用插件的导入类声明。插件的参数可以通过提要选项传递。看见 feed options 举个例子。

内置插件

classscrapy.extensions.postprocessing.GzipPlugin(file: BinaryIOfeed_options: Dict[str, Any])[源代码]

使用以下命令压缩接收的数据 gzip 。

已接受 feed_options 参数:

  • gzip_compresslevel

  • gzip_mtime

  • gzip_filename

看见 gzip.GzipFile 有关参数的详细信息,请参阅。

classscrapy.extensions.postprocessing.LZMAPlugin(file: BinaryIOfeed_options: Dict[str, Any])[源代码]

使用以下命令压缩接收的数据 lzma 。

已接受 feed_options 参数:

  • lzma_format

  • lzma_check

  • lzma_preset

  • lzma_filters

注解

lzma_filters 不能在PyPy版本7.3.1及更早版本中使用。

看见 lzma.LZMAFile 有关参数的详细信息,请参阅。

classscrapy.extensions.postprocessing.Bz2Plugin(file: BinaryIOfeed_options: Dict[str, Any])[源代码]

使用以下命令压缩接收的数据 bz2 。

已接受 feed_options 参数:

  • bz2_compresslevel

看见 bz2.BZ2File 有关参数的详细信息,请参阅。

自定义插件

每个插件都是一个必须实现以下方法的类:

__init__(selffilefeed_options)

初始化插件。

参数
  • file -- 类文件对象至少具有 write , tell 和 close 实施的方法

  • feed_options (dict) -- 特定于源的 options

write(selfdata)

Process and write data (bytes or memoryview) into the plugin's target file. It must return number of bytes written.

close(self)

关闭目标文件对象。

要将参数传递给插件,请使用 feed options 。然后,您可以从 __init__ 插件的方法。

设置

以下是用于配置源导出的设置:

  • FEEDS (强制性)

  • FEED_EXPORT_ENCODING

  • FEED_STORE_EMPTY

  • FEED_EXPORT_FIELDS

  • FEED_EXPORT_INDENT

  • FEED_STORAGES

  • FEED_STORAGE_FTP_ACTIVE

  • FEED_STORAGE_S3_ACL

  • FEED_EXPORTERS

  • FEED_EXPORT_BATCH_ITEM_COUNT


上一篇:项目管道下一篇:请求和响应

Archiver|手机版|笨鸟自学网 ( 粤ICP备20019910号 )

GMT+8, 2024-10-18 13:13 , Processed in 0.036902 second(s), 17 queries .

© 2001-2020

返回顶部