# super-spiderflow **Repository Path**: MrRobot-k/super-spiderflow ## Basic Information - **Project Name**: super-spiderflow - **Description**: super-spiderflow修改版 - **Primary Language**: Java - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-04-17 - **Last Updated**: 2024-06-24 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README

[介绍](#介绍) | [特性](#特性) | [插件](#插件) | DEMO站点 | 文档 | 更新日志 | [截图](#项目部分截图) | [其它开源](#其它开源项目) | [免责声明](#免责声明) ## 介绍 - 在spider-flow的基础上增加了权限控制系统,以后可以扩展到单点登录,与其他系统配合使用 - 平台以流程图的方式定义爬虫,是一个高度灵活可配置的爬虫平台 ## 特性 - [x] 增加了登录页面,使系统具备安全使用的能力(新增特性) - [x] 引入Sa-Token权限认证开源项目,兼容多种权限认证协议(新增特性) - [x] 引入AJ-Captcha验证码开源项目,支持多种验证码验证(新增特性) - [x] 增加 Kbase插件,Kbase数据源配置(新增特性) - [x] 支持Xpath/JsonPath/css选择器/正则提取/混搭提取 - [x] 支持JSON/XML/二进制格式 - [x] 支持多数据源、SQL select/selectInt/selectOne/insert/update/delete - [x] 支持爬取JS动态渲染(或ajax)的页面 - [x] 支持代理 - [x] 支持自动保存至数据库/文件 - [x] 常用字符串、日期、文件、加解密等函数 - [x] 支持插件扩展(自定义执行器,自定义方法) - [x] 任务监控,任务日志 - [x] 支持HTTP接口 - [x] 支持Cookie自动管理 - [x] 支持自定义函数 ## 插件 - [x] [Selenium插件](https://gitee.com/ssssssss-team/spider-flow-selenium) - [x] [Redis插件](https://gitee.com/ssssssss-team/spider-flow-redis) - [x] [OSS插件](https://gitee.com/ssssssss-team/spider-flow-oss) - [x] [Mongodb插件](https://gitee.com/ssssssss-team/spider-flow-mongodb) - [x] [IP代理池插件](https://gitee.com/ssssssss-team/spider-flow-proxypool) - [x] [OCR识别插件](https://gitee.com/ssssssss-team/spider-flow-ocr) - [x] [电子邮箱插件](https://gitee.com/ssssssss-team/spider-flow-mailbox) - [x] [Kbase插件](https://gitee.com/ssssssss-team/spider-flow-kbase) ## 项目部分截图 ### 登录页面 - http://localhost:8088 - 默认用户【用户名:spiderflow 密码:654321】 ![登录页面](https://gitee.com/MrRobot-k/super-spiderflow/raw/master/figure-bed/show-login-index.gif) ### 爬虫列表 ![爬虫列表](https://images.gitee.com/uploads/images/2020/0412/104521_e1eb3fbb_297689.png "list.png") ### 爬虫测试 ![爬虫测试](https://images.gitee.com/uploads/images/2020/0412/104659_b06dfbf0_297689.gif "test.gif") ### Debug ![Debug](https://images.gitee.com/uploads/images/2020/0412/104741_f9e1190e_297689.png "debug.png") ### 日志 ![日志](https://images.gitee.com/uploads/images/2020/0412/104800_a757f569_297689.png "logo.png")