Scrapy异常

不规则事件被称为例外。在Scrapy中,由于诸如缺少配置,从项目管道中删除项目等原因而引发异常。以下是Scrapy中提及的异常及其应用程序的列表。

DropItem

物品管道利用此异常来停止在任何阶段处理物品。它可以写成:

exception (scrapy.exceptions.DropItem)

CloseSpider

此异常用于使用回调请求停止蜘蛛。它可以写成:

exception (scrapy.exceptions.CloseSpider)(reason = 'cancelled')

它包含名为 reason(str)的 参数,它指定关闭的原因。

例如,下面的代码显示了这种异常用法:

def parse_page(self, response):
   if 'Bandwidth exceeded' in response.body:
      raise CloseSpider('bandwidth_exceeded')

 

IgnoreRequest

调度程序或下载器中间件使用此例外来忽略请求。它可以写成:

exception (scrapy.exceptions.IgnoreRequest)

 

NotConfigured

它表示缺少配置情况,应该在组件构造函数中提出。

exception (scrapy.exceptions.NotConfigured)

如果禁用了以下任何组件,则可能会引发此异常。

  • 扩展
  • Item pipelines
  • 下载中间件
  • 蜘蛛中间件

 

不支持

当不支持任何功能或方法时引发此异常。它可以写成:

exception (scrapy.exceptions.NotSupported)

要从网页中取消数据,首先需要创建Scrapy项目,您将在其中存储代码。要创建一个新目录,请运行以下命令:scrapy startproject first_scrapy上面的代码将创建一个名为first_scra ...