笨鸟编程-零基础入门Pyhton教程 › 首页 ›Scrapy中文手册 › 查看内容

命令行工具

2022-2-21 06:00| 发布者: 笨鸟自学网| 查看: 11002| 评论: 0

摘要: 碎屑通过控制scrapy命令行工具，这里称为“scrapy工具”，用于区分子命令，我们称之为“命令”或“scrapy命令”。Scrapy工具提供了多个命令，用于多种目的，每个命令接受一组不同的参数和选项。(Thescrapydeploy命令 ...

基因蜘蛛¶

Syntax： scrapy genspider [-t template] <name> <domain>
需要项目： no

在当前文件夹或当前项目的 spiders 文件夹（如果从项目内部调用）。这个 <name> 参数设置为spider的 name ，同时 <domain> 用于生成 allowed_domains 和 start_urls 蜘蛛的属性。

使用实例：

$ scrapy genspider -l
Available templates:
  basic
  crawl
  csvfeed
  xmlfeed

$ scrapy genspider example example.com
Created spider 'example' using template 'basic'

$ scrapy genspider -t crawl scrapyorg scrapy.org
Created spider 'scrapyorg' using template 'crawl'

这只是一个基于预先定义的模板创建spider的快捷命令，但肯定不是创建spider的唯一方法。您可以自己创建蜘蛛源代码文件，而不是使用这个命令。

爬行¶

Syntax： scrapy crawl <spider>
需要项目： yes

开始用蜘蛛爬行。

用法示例：

$ scrapy crawl myspider
[ ... myspider starts crawling ... ]

检查¶

Syntax： scrapy check [-l] <spider>
需要项目： yes

运行合同检查。

用法示例：

$ scrapy check -l
first_spider
  * parse
  * parse_item
second_spider
  * parse
  * parse_item

$ scrapy check
[FAILED] first_spider:parse_item
>>> 'RetailPricex' field is missing

[FAILED] first_spider:parse
>>> Returned 92 requests, expected 0..4 

1 2 3 456 7 8 9 / 9 页下一页

收藏分享邀请

上一篇：Scrapy 教程下一篇：蜘蛛

		自动登录	找回密码
密码			立即注册

命令行工具

基因蜘蛛¶

爬行¶

检查¶

相关分类