火车采集器 官方版v9.0

2024-06-06发布者:wx20230305205025大小: 下载:0

文件大小:

软件介绍

 火车采集器免费版(LocoySpider)是一款专业的功能强大的网络数据/信息挖掘软件。火车采集器免费版(LocoySpider)通过灵活的配置,您可以很轻松的从网页上抓取文字、图片、文件等任何资源。

更新日志

      二级代理服务器新增Socks代理

      任务运行过程中可修改线程数等参数,实时调节运行速度,添加可查看任务运行当前及总体速度功能

      支持SSH(SFTP文件)上传

      内容提取新增JSON提取方式,提取JSON数据更加简单

      插件编辑器新增C#源码文件插件,类似PHP源码插件一样,编辑后直接生效,但比PHP源码插件支持更多的插件接口

      软件闪退,支持保存未完成的任务进度

      新增消息机制

      V9将采网址和采内容的方式合并,列表采集及内容采集使用不同队列,优化采集流程,更新数据内容的方式由Update改为insert,大幅提升采集及入库速度;

      任务运行合并到统一界面,添加“实时数据”查看和“任务详情”统计;

      修改了原有的无限级列表页网址获取模式,使无限级配置操作更加简单;

      字段重复性对比功能不再使用数据库unique方式,改为内存Md5_16对比,更加精准;

      标签数据的来源更加细致化,可设置从默认页、分页和多页的源码,URL地址及返回头信息中提取。

软件特色

  分布式高速采集

  任务分配至多个客户端,同时运行采集,效率倍增。

  多识别系统

  配备正文识别、中文分词识别、任意编码识别等多种识别系统,智能识别操作更轻松。

  可选验证方式

  可选择是否使用加密狗,随时保障数据安全。

  全自动运行

  无需人工值守操作,任务完成后自动关机。

  替换功能

  同义,近义词替换、参数替换,伪原创必备技能。

  任意文件格式下载

  图片、压缩文件、视频等任意格式的文件都能轻松下载。

  采集监控系统

  实时监控采集,确保数据的准确性。

  支持多数据库

  支持Access/MySQL/MsSQL/Sqlite/Oracle多种类型的数据库保存及发布。

  无限级多页采集

  支持包含ajax请求数据在内的多个页面信息的无限级采集。

  支持扩展

  支持接口和插件扩展,满足各种采发需求。

功能介绍

  真正通用

  采集不限网页,不限内容,支持多种扩展,打破操作局限。采什么,如何采,都由您决定!

  高效稳定

  分布式高速采集系统,多个大型服务端同时稳定运作,快速分解任务量,最大化提升效率。

  性价比高

  高性能的产品,搭配亲民的价格,“为客户节约成本,提升价值”是火车采集器的服务理念。

  数据精准

  内置采集监控系统,实时报错及时修复;采集发布时确保数据零遗漏,为用户呈现最精准的数据。

FAQ

  登录信息设置: 对于部分需要登录的网站,需要设置此项。

image.png

  点击 点击设置 按钮,跳转到第四步其他设置——Http请求设置

发表评论(共0条评论)
请自觉遵守互联网相关政策法规,评论内容只代表网友观点,发表审核后显示!

版权声明:

1 本站所有资源(含游戏)均是软件作者、开发商投稿,任何涉及商业盈利目的均不得使用,否则产生的一切后果将由您自己承担!

2 本站将不对任何资源负法律责任,所有资源请在下载后24小时内删除。

3 若有关在线投稿、无法下载等问题,请与本站客服人员联系。

4 如侵犯了您的版权、商标等,请立刻联系我们并具体说明情况后,本站将尽快处理删除,联系QQ:2499894784

返回顶部