剪贴的主要目标是从非结构化源(通常是网页)中提取结构化数据。 Spiders 将提取的数据返回为 items ,定义键-值对的Python对象。 支点 multiple types of items . 创建项目时,可以使用所需的任何类型的项目。当您编写接收项目的程式码时,您的程式码应该 work for any item type . 项目类型¶Scrapy支持以下类型的项目,通过 itemadapter 类库: dictionaries , Item objects , dataclass objects 和 attrs objects . 辞典¶作为项目类型, 项目对象¶
例子:: from scrapy.item import Item, Field
class CustomItem(Item):
one_field = Field()
another_field = Field() |
Archiver|手机版|笨鸟自学网 ( 粤ICP备20019910号 )
GMT+8, 2024-11-21 17:51 , Processed in 0.050279 second(s), 17 queries .