在实现scraper时,最经常需要的功能之一是能够正确地存储被抓取的数据,这通常意味着用被抓取的数据(通常称为“导出提要”)生成一个“导出文件”,供其他系统使用。 Scrapy在提要导出中提供了开箱即用的功能,它允许您使用多种序列化格式和存储后端来生成带有所刮取项的提要。 序列化格式¶为了序列化 爬取 的数据,提要导出使用 Item exporters . 开箱即用支持这些格式:
但是您也可以通过 JSON¶
杰森线¶
CSV¶
XML¶
泡菜¶
元帅¶
|
Archiver|手机版|笨鸟自学网 ( 粤ICP备20019910号 )
GMT+8, 2024-11-21 18:13 , Processed in 0.032992 second(s), 17 queries .