笨鸟编程-零基础入门Pyhton教程

 找回密码
 立即注册

登录

发布者: 笨鸟自学网



命令行选项

有一些命令行参数可用于所有命令,您可以使用这些参数来覆盖有关日志记录的一些零碎设置。

  • --logfile FILE

    重写 LOG_FILE

  • --loglevel/-L LEVEL

    重写 LOG_LEVEL

  • --nolog

    集合 LOG_ENABLED 到 False

参见

模块 logging.handlers

有关可用处理程序的进一步文档

自定义日志格式

可以通过扩展为不同的操作设置自定义日志格式 LogFormatter 课程和制作 LOG_FORMATTER 指向你的新班级。

classscrapy.logformatter.LogFormatter[源代码]

用于为不同操作生成日志消息的类。

所有方法都必须返回一个列出参数的字典 level , msg 和 args 调用时将用于构造日志消息 logging.log .

方法输出的字典键:

  • level 是该操作的日志级别,可以使用 python logging library : logging.DEBUG , logging.INFO , logging.WARNING , logging.ERROR 和 logging.CRITICAL .

  • msg 应该是可以包含不同格式占位符的字符串。此字符串,格式为 args ,将是该行动的长期信息。

  • args 应该是一个tuple或dict,其中的格式占位符为 msg .最后的日志消息计算为 msg % args .

用户可以定义自己的 LogFormatter 如果要自定义每个操作的日志记录方式,或者希望完全忽略它,则初始化。为了省略记录操作,该方法必须返回 None .

以下是有关如何创建自定义日志格式化程序以降低从管道中删除项时日志消息的严重性级别的示例:

class PoliteLogFormatter(logformatter.LogFormatter):
    def dropped(self, item, exception, response, spider):
        return {
            'level': logging.INFO, # lowering the level from logging.WARNING
            'msg': "Dropped: %(exception)s" + os.linesep + "%(item)s",
            'args': {
                'exception': exception,
                'item': item,
            }
        }
crawled(requestresponsespider)[源代码]

当爬虫找到网页时记录一条消息。

download_error(failurerequestspidererrmsg=None)[源代码]

记录来自spider的下载错误消息(通常来自引擎)。

2.0 新版功能.

dropped(itemexceptionresponsespider)[源代码]

当某个项在通过项管道时被丢弃时,记录该消息。

item_error(itemexceptionresponsespider)[源代码]

当一个项目在通过项目管道时出错时,记录消息。

2.0 新版功能.

scraped(itemresponsespider)[源代码]

当一个项目被蜘蛛抓取时记录一条消息。

spider_error(failurerequestresponsespider)[源代码]

记录来自spider的错误消息。

2.0 新版功能.


上一篇:例外情况下一篇:统计数据集合

Archiver|手机版|笨鸟自学网 ( 粤ICP备20019910号 )

GMT+8, 2025-1-3 03:10 , Processed in 0.015091 second(s), 17 queries .

© 2001-2020

返回顶部