Crawlab(分布式爬虫管理平台) [V0.5.1免费版]

2024-10-26发布者:zhangliang大小: 下载:0

文件大小:

软件介绍

Crawlab是根据Golang的分布式爬虫管理系统,适用Python、NodeJS、Go、Java、PHP等多种多样计算机语言及其多种多样爬虫架构,分成Docker、立即布署、Kubernetes三种安裝方法!

image.png

软件简介

  Crawlab架构:

  Crawlab的架构包含了一个主节点(Master Node)和好几个工作节点(Worker Node),及其承担通讯和数据信息储存的360030.html">Redis和MongoDB数据库查询。

  前端开发运用向主节点要求数据信息,主节点根据MongoDB和Redis来执行任务发放生产调度及其布署,工作节点接到每日任务以后,刚开始实行爬虫每日任务,并将每日任务結果储存到MongoDB。架构相对性于v0.3.0以前的Celery版本号有一定的精减,去除开多余的节点监管控制模块Flower,节点监管关键由Redis进行。

  主节点

  主节点是全部Crawlab架构的关键,归属于Crawlab的多媒体系统。主节点承担与前端开发运用开展通讯,并根据Redis将爬虫每日任务派发送给工作节点。另外,主节点会同歩(布署)爬虫给工作节点,根据Redis和MongoDB的GridFS。

  工作节点

  工作节点的关键作用是实行爬虫每日任务和储存爬取数据信息与系统日志,而且根据Redis的PubSub跟主节点通讯。根据提升工作节点总数,Crawlab能够保证横着拓展,不一样的爬虫每日任务能够分派到不一样的节点上实行。

  MongoDB

  MongoDB是Crawlab的运作数据库查询,储存有节点、爬虫、每日任务、计划任务等数据信息,此外GridFS文档储存方法是主节点储存爬虫文档并同歩到工作节点的正中间媒体。

  Redis

  Redis是十分火爆的Key-Value数据库查询,在Crawlab中关键完成节点间数据通讯的作用。比如,节点会将自身信息内容根据HSET储存在Redis的nodeshach目录中,主节点依据hach目录来分辨线上节点。

  前端开发

  前端开发是一个根据Vue-Element-Admin的单页应用。在其中器重了许多 Element-UI的控制来适用相对的展现。

发表评论(共0条评论)
请自觉遵守互联网相关政策法规,评论内容只代表网友观点,发表审核后显示!

版权声明:

1 本站所有资源(含游戏)均是软件作者、开发商投稿,任何涉及商业盈利目的均不得使用,否则产生的一切后果将由您自己承担!

2 本站将不对任何资源负法律责任,所有资源请在下载后24小时内删除。

3 若有关在线投稿、无法下载等问题,请与本站客服人员联系。

4 如侵犯了您的版权、商标等,请立刻联系我们并具体说明情况后,本站将尽快处理删除,联系QQ:2499894784

返回顶部