笨鸟编程-零基础入门Pyhton教程 › 首页 ›Scrapy中文手册 › 查看内容

选择器

SelectorList对象¶

classscrapy.selector.SelectorList(iterable=(), /)[源代码]¶

这个 SelectorList 类是内置的子类 list 类，它提供了一些附加方法。

xpath(xpath, namespaces=None, **kwargs)[源代码]¶

打电话给 .xpath() 此列表中的每个元素的方法，并将其结果扁平化为另一个 SelectorList .

query is the same argument as the one in Selector.xpath()

namespaces 是可选的 prefix: namespace-uri 将附加前缀的映射（dict）映射到 register_namespace(prefix, uri) . 相反 register_namespace() ，这些前缀不会保存以备将来调用。

可以使用任何其他命名参数来传递xpath表达式中xpath变量的值，例如：：

selector.xpath('//a[href=$url]', url="http://www.example.com")

css(query)[源代码]¶

打电话给 .css() 此列表中的每个元素的方法，并将其结果扁平化为另一个 SelectorList .

query is the same argument as the one in Selector.css()

getall()[源代码]¶

打电话给 .get() 每个元素的方法都是这个列表，并将它们的结果作为一个Unicode字符串列表平展地返回。

参见： extract（）和extract_first（）。

get(default=None)[源代码]¶

返回的结果 .get() 对于此列表中的第一个元素。如果列表为空，则返回默认值。

参见： extract（）和extract_first（）。

re(regex, replace_entities=True)[源代码]¶

打电话给 .re() 方法，并以unicode字符串列表的形式返回结果。

默认情况下，字符实体引用替换为其相应的字符（除了 & 和 < .经过 replace_entities 作为 False 关闭这些替换。

re_first(regex, default=None, replace_entities=True)[源代码]¶

打电话给 .re() 方法，并以Unicode字符串返回结果。如果列表为空或regex不匹配，则返回默认值 (None 如果未提供参数）。

默认情况下，字符实体引用替换为其相应的字符（除了 & 和 < .经过 replace_entities 作为 False 关闭这些替换。

attrib¶

返回第一个元素的属性字典。如果列表为空，则返回空的dict。

参见：选择元素属性 .

1 ... 5 6 7 8 9 10 111213 / 13 页下一页

Scrapy中文手册

Scrapy一目了然

安装指南

Scrapy 教程

命令行工具

蜘蛛

选择器

项目

项目加载器

Scrapy shell

项目管道

Feed 导出

请求和响应

链接提取器

设置

例外情况

统计数据集合

发送电子邮件

远程登录控制台

常见问题

调试spiders

蜘蛛合约

常用做法

宽爬行

使用浏览器的开发人员工具进行抓取

选择动态加载的内容

调试内存泄漏

下载和处理文件和图像

部署蜘蛛

AutoThrottle 扩展

标杆管理

作业：暂停和恢复爬行

协同程序

asyncio

体系结构概述

下载器中间件

蜘蛛中间件

扩展

核心API

信号

调度程序

条目导出器

		自动登录	找回密码
密码			立即注册