专注web开发10年

网站采集神器

文章采集、评论采集、其它数据表采集、伪原创、多任务可视化采集,轻松搬运
售价:¥599¥399

购买本插件后,需在本站进行服务器IP授权(不限制域名)。授权IP指的是服务器上网的公网IP。授权IP数量为:可风网购买用户为3个,zblog购买用户为2个。

授权IP数量指的是同时启用的授权IP数量。用户可以不限次数地免费自助授权IP、删除已授权IP和禁用IP。IP被禁用时,仅无法进行配置,但网站的其他功能仍可正常使用。

在可风网购买的用户,可以使用“可风客户端”一键安装应用并自动完成授权。

应用截图

插件主要界面 采集任务界面 公共配置 文章采集配置

网站采集神器是一款zblog采集插件,能帮助网站节省大量的搬运劳动力,该插件不仅仅支持文章采集,还支持文章中的评论采集,其它插件(非文章)的数据采集

特别功能

  1. 多任务可视化采集

  2. 采集量图表统计,历史采集状况一看便知

  3. 支持文章评论采集(仅第一页评论)

  4. 支持大多数主题、插件数据采集(任意数据表入库)

  5. 第三方触发自动采集

  6. 多标签页,多线程采集

  7. 文章伪原创(5118、百度翻译)

 

本插件一些规则配置方面,参考了火车头软件

可以采集市面上大部分的网站,国内知名网站未做采集测试,并且采集此类网站存在版权问题


免责申明

因为本插件属于“蜘蛛”性质,采集网站请遵守对方的robots.txt规则。

如产生(包括但不限于robots规则限制问题、版权、违规内容),相应的法律责任由使用者自行承担。

因采集过于频繁导致被对方拉黑IP的,与本插件无关

插件使用教程

网站采集神器用户手册

使用本插件,学会一点基本的css选择器即可采集大部分网站

评论列表
無已
2023-07-08 09:59
希望增加勾选的链接可以强制重新采集的功能
过不住
2022-01-03 17:48
放到宝塔URL,自动采集,但不能成功,日志显示没有权限是因为什么
长风
2020-10-22 13:53
绝对 好物 物有所值!!!

谨慎发言,无意义评论会被删除!
登录后可发布评论
A加油(正规号卡)
问题分类:插件 最新回答:2年前 (2022-09-13)
755 1

v1.7 2023-11-14 22:11

  1. [优化]图片下载可配置调用接口Filter_Plugin_Upload_SaveFile
  2. [优化]图片下载可配置每个内容中保存的图片数量,剩余图片从内容移除
  3. [优化]图片下载可配置不检查图片的响应头:Content-Type
  4. [优化]链接采集时,可在“未采集”页面操作内容采集

v1.6 2023-11-07 18:04

  1. [优化]链接采集可看到采集进度,避免采集多页会造成连接超时问题
  2. [优化]采集限速可配置低于1秒的时间
  3. [优化]可配置非单线程采集
  4. [警告]本版本开始自动采集链接功能有变化,仅会对“未采集”列表中的链接进行采集,不会进行链接采集

v1.5.7 2023-09-07 21:32

  1. [修复]某些情况下配置“不允许空数据”无效的问题

v1.5.6 2023-09-03 15:05

  1. [新增]内容采集规则可选择“允许空数据”(在采集时如果该规则无法匹配到内容或内容为空那么则跳过采集,默认为允许)

v1.5.5 2023-08-23 21:21

  1. [修复]入库Meta多个多维数组无效的问题

v1.5.4 2023-07-22 16:03

  1. [修复]某些情况下目标站图片使用跟随协议而无法下载图片的问题

v1.5.3 2023-07-22 16:02

  1. [修复]某些情况下目标站图片使用跟随协议而无法下载图片的问题

v1.5.2 2022-10-25 10:51

  1. [优化]链接采集json支持“列表值”为空,为空即代表json直接就是url数组
  2. [优化]json “url键名”支持多链定位

v1.5.1 2022-10-24 13:42

  1. [修复]上版本产生的一个问题

v1.5 2022-10-23 21:41

  1. [新增]链接采集、内容采集支持json识别
  2. [新增]链接采集可以对采集的链接进行字符替换
  3. [优化]发布规则meta字段支持多维数组

v1.4.7 2022-06-09 14:44

  1. [优化]文章采集设置“保存到文本”采集时会在“保存txt路径”自动建立一个以任务名称命名的文件夹,并存放在该文件夹

v1.4.6 2022-04-06 11:18

  1. [修复]无法替换下载图片链接问题

v1.4.5 2022-04-05 20:56

  1. [修复]某些情况下重复下载图片的问题

v1.4.4 2022-04-04 11:15

  1. [修复]无法下载mip图片的问题
  2. [优化]下载图片时,请求头会使用其它配置中的header

v1.4.3 2022-01-23 16:27

  1. [修复]某些图片下载失败的问题

v1.4.2 2022-01-07 11:22

  1. [修复]在zblog1.7下触发自动采集文章入库状态为“没有权限”的问题

v1.4.1 2021-11-19 16:09

  1. 修正文章入库配置“5118伪原创”名称错误的问题,改为“5118一键智能换词API”,API没换,更新后无需处理
  2. [修复]5118一键智能换词API总开关无效的问题

v1.4 2021-11-13 16:13

  1. [优化]5188伪原创同时开始“标题伪原创”和“正文伪原创”时,一次性请求,不会请求两次
  2. [新增]内容采集可以配置“间隔内容”,当匹配到多个内容时,入库时多个内容合并时之间的内容
  3. [新增]发布规则增加“截取字符串”,截取指定范围的字符长度

v1.3 2021-07-06 16:33

  1. [新增]5188一键智能改写API

v1.2.4 2021-03-03 19:36

  1. [修复]链接采集填充异常的问题

v1.2.3 2021-02-27 19:48

  1. [修复]部分网站采集的链接无法正确填充的问题

v1.2.2 2021-02-27 16:10

  1. [修复]问答插件采集分类配置无效的问题

v1.2.1 2021-02-24 11:39

  1. [修复]不信任的ssl证书图片下载失败的问题

v1.2 2021-01-30 22:53

  1. [优化]文章采集“保存到文本”中的内容进行简单的代码格式化
  2. [优化]文章采集“保存到文本”可配置“保存后不发布文章”
  3. [新增]文章采集百度翻译伪原创
  4. [新增]文章采集可配置字数最低限制

v1.1.1 2021-01-04 16:16

  1. [优化]公共配置只的内容替换将会在所有内容处理后最后一步执行
  2. [优化]公共配置内容替换input文本框改为textarea文本框

v1.1.0 2021-01-04 16:03

  1. [修复]链接匹配正则匹配方式无效的问题

v1.0.9 2021-01-01 16:56

  1. [修复]某些情况下排除多个元素部分无法排除的问题

v1.0.8 2020-11-21 10:12

  1. [修复]部分服务器导入的规则数据太长导入失败的问题

v1.0.7 2020-11-09 20:52

  1. [修复]文章发布模块,不能保存txt文件的问题
  2. 插件入口改到顶部导航

v1.0.6 2020-11-03 20:49

  1. [修复]链接采集链接排除中的回车符导致采集不到链接的问题

v1.0.5 2020-10-18 20:47

  1. [新增]规则配置可选择是否调用其它插件接口Filter_Plugin_Upload_SaveBase64File
  2. [修复]前后截取部分情况下无法截取的问题

v1.0.4 2020-10-16 20:55

  1. [修复]部分情况下排除元素消失的问题

v1.0.3 2020-10-14 22:14

  1. [优化]当转存图片时,对方站点证书不匹配造成的失败问题(忽略证书检测)
  2. [新增]插件右上角新增“使用手册”菜单

v1.0.2 2020-10-10 20:59

  1. [新增]文章采集,可以设置保存到txt文件
  2. [新增]链接采集可配置“必须包含”“不能包含”
  3. [新增]链接采集可选择“打乱链接”,采集后的链接不是按照原页面顺序

v1.0.1 2020-10-08 17:59

  1. meta支持数组,结尾用[]表示

v1.0 2020-10-07 20:12

  1. 应用首发