353194 hexleowang 1578921125
88
无依赖极简网页爬取组件,能在移动设备上运行的微型爬虫。
Java
10年多前
324379 zhangyingwei 1578919975
84
又一个 java 爬虫
Java
6年前
74
分布式敏捷的爬虫框架
Java
7年多前
673473 1967988842 1609901731
74
使用JCEF(chromium内核)开发的抓取数据浏览器,可以用来制作浏览器,也可以用来制作爬虫。
Java
5年多前
74
A configurable web spider with a easy-to-use WebUI interface
Java
8年多前
428059 sdc2012 1578923507
73
Spring Boot项目框架,结合多种开源技术,知乎信息中转持久化的数据流平台,并提供HTML+JSON和RabbitMQ等消息接口,从而使有兴趣的伙伴开发并使用其熟悉的语言环境,实现信息爬取,从而持久化到此项目中来,完成最开始的开发目标。
Java
8年前
1646371 tyoui 1578956781
73
最新代码链接:码云上不在更新
Java
接近7年前
1155976 slkb 1578989907
73
一个轻量级网络多线程爬虫框架
Java
6年多前
55
一个支持集群部署的分布式 DHT 网络爬虫
Java
6年前
80950 hcxy 1578916693
54
java抓取微信最新推送内容
Java
8年多前
145212 gitclebeg 1620614744
50
nlp项目基础框架:爬虫,针对动态网页(JS)的专有爬虫
Java
6年多前
49
Crawler基于Java开发的一款跨平台爬虫,可以使用Shell脚本和DOS命令进行任务式处理
Java
4年多前
94173 daqiangge 1578917213
49
java编写的带有web管理后台的抓取程序,自动生成搜索URL,简单实现数据抽取即可,支持多机,任务定时自动运行等功能,提供各种扩展点,适应各种情况
Java
11年多前
39
运行于java环境的一个免费开源的企业信息采集器(简单的java网络爬虫)。 信息采集完成后自动导出Excel表格。 基于Jsoup+Poi+Sqlite开发完成。
Java
7年多前
670 panmingguang2004 1578913850
38
分布式数据抓取平台
Java
9年多前

搜索帮助