笨鸟编程-零基础入门Pyhton教程

 找回密码
 立即注册

设置

发布者: 笨鸟自学网



GCS_PROJECT_ID

违约: None

在上存储数据时将使用的项目ID Google Cloud Storage .

ITEM_PIPELINES

违约: {{}}

包含要使用的项目管道及其订单的dict。顺序值是任意的,但通常在0-1000范围内定义它们。低订单处理优先于高订单。

例子::

ITEM_PIPELINES = {
    'mybot.pipelines.validate.ValidateMyItem': 300,
    'mybot.pipelines.validate.StoreMyItem': 800,
}

ITEM_PIPELINES_BASE

违约: {{}}

包含默认情况下在Scrapy中启用的管道的dict。您不应该在项目中修改此设置,请修改 ITEM_PIPELINES 相反。

JOBDIR

违约: ''

指示用于存储爬网状态的目录的字符串 pausing and resuming crawls 

LOG_ENABLED

违约: True

是否启用日志记录。

LOG_ENCODING

违约: 'utf-8'

用于日志记录的编码。

LOG_FILE

违约: None

用于日志记录输出的文件名。如果 None ,将使用标准错误。

LOG_FILE_APPEND

违约: True

如果 False 指定的日志文件 LOG_FILE 将被覆盖(如果有,则丢弃以前运行的输出)。

LOG_FORMAT

违约: '%(asctime)s [%(name)s] %(levelname)s: %(message)s'

用于格式化日志消息的字符串。请参阅 Python logging documentation 所有可用占位符列表。

LOG_DATEFORMAT

违约: '%Y-%m-%d %H:%M:%S'

用于格式化日期/时间的字符串,扩展 %(asctime)s 占位符 LOG_FORMAT . 参考 Python datetime documentation 对于可用指令的整个列表。

LOG_FORMATTER

违约: scrapy.logformatter.LogFormatter

用于的类 formatting log messages 对于不同的行动。

LOG_LEVEL

违约: 'DEBUG'

要记录的最低级别。可用级别包括:严重、错误、警告、信息、调试。有关详细信息,请参阅 登录 .

LOG_STDOUT

违约: False

如果 True ,进程的所有标准输出(和错误)都将重定向到日志。例如,如果你 print('hello') 它会出现在残缺的木头上。

LOG_SHORT_NAMES

违约: False

如果 True 日志只包含根路径。如果设置为 False 然后显示负责日志输出的组件


上一篇:链接提取器下一篇:例外情况

Archiver|手机版|笨鸟自学网 ( 粤ICP备20019910号 )

GMT+8, 2024-9-8 11:47 , Processed in 0.018351 second(s), 17 queries .

© 2001-2020

返回顶部