Scrapy 可重复使用 item pipelines 用于下载附加到特定项目的文件(例如,当您 爬取 产品并希望在本地下载其图像时)。这些管道共享一些功能和结构(我们将它们称为媒体管道),但通常您可以使用文件管道或图像管道。 两条管道都实现了以下功能:
图像管道有一些用于处理图像的额外功能:
这些管道还保留当前正在计划下载的媒体URL的内部队列,并将到达的包含相同媒体的响应连接到该队列。这样可以避免在多个项目共享同一媒体时多次下载同一媒体。 使用文件管道¶使用时的典型工作流
使用图像管道¶使用 使用 图像管道需要 Pillow 4.0.0或更高版本。它用于缩略图和将图像规格化为JPEG/RGB格式。 启用媒体管道¶要启用媒体管道,必须首先将其添加到项目中 对于图像管道,请使用: ITEM_PIPELINES = {'scrapy.pipelines.images.ImagesPipeline': 1}
对于文件管道,请使用: ITEM_PIPELINES = {'scrapy.pipelines.files.FilesPipeline': 1}
注解 您还可以同时使用文件和图像管道。 然后,将目标存储设置配置为用于存储下载的图像的有效值。否则,管道将保持禁用状态,即使将其包含在 对于文件管道,设置 FILES_STORE = '/path/to/valid/dir'
对于图像管道,设置 IMAGES_STORE = '/path/to/valid/dir' |
Archiver|手机版|笨鸟自学网 ( 粤ICP备20019910号 )
GMT+8, 2024-12-22 02:34 , Processed in 0.108765 second(s), 17 queries .