# jfinal_jsoup_meinvtu **Repository Path**: 909854136/jfinal_jsoup_meinvtu ## Basic Information - **Project Name**: jfinal_jsoup_meinvtu - **Description**: JFinal+JSoup开发的爬虫案例—抓美女 - **Primary Language**: Java - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 9 - **Forks**: 9 - **Created**: 2019-06-11 - **Last Updated**: 2023-11-12 ## Categories & Tags **Categories**: spider **Tags**: None ## README 去年,做了几个JFinal项目,大量使用了Java爬虫去全网抓取数据,清洗筛选后入库,成为本地结构化数据。 Java中JSOUP做HTML解析是最好的工具,没有之一。 之前听过一句话,大体意思就是 我们所能访问的网页本身就是一个数据宝藏,天然的对外数据接口。 只要我们能拿到网页的Html代码,就可以拿到网站的公开数据。 利用JSoup针对直接加载显示数据的网页,也可以轻松拿到Html代码,后面的操作类似JQuery的API,有这类似的DOM操作形式。 还可以扩展爬虫的能力,分布式,多线程,异步,定时任务执行,总之,了解和核心使用方法,剩下的都是怎么玩儿的事儿了! **项目视频演示地址:** [https://www.bilibili.com/video/av54760586](https://www.bilibili.com/video/av54760586) **项目截图:** 1、首页 ![首页](https://images.gitee.com/uploads/images/2019/0611/133120_9ac066c1_736.jpeg "10114_20190322064751[1].jpg") 2、启动爬虫,雷达扫描 ![雷达扫描](https://images.gitee.com/uploads/images/2019/0611/133258_a2bf2d4a_736.jpeg "10114_20190322064812[1].jpg") 3、添加明星 ![添加](https://images.gitee.com/uploads/images/2019/0611/133353_41408477_736.png "10114_20190322064931[1].png") 4、相册主页 ![相册](https://images.gitee.com/uploads/images/2019/0611/133424_870565fb_736.jpeg "10114_20190322064938[1].jpg") 5、相册里的照片 ![照片列表](https://images.gitee.com/uploads/images/2019/0611/133449_4840b679_736.jpeg "10114_20190322064955[1].jpg") 6、幻灯片播放 ![幻灯片播放](https://images.gitee.com/uploads/images/2019/0611/133517_a151bad5_736.jpeg "10114_20190316221025[1].jpg") 7、大图单页 ![大图单页](https://images.gitee.com/uploads/images/2019/0611/133541_c8074198_736.jpeg "10114_20190322065125[1].jpg") **代码使用技术** [JFinal](http://www.jfinal.com) JFinal Undertow Bootstrap JQuery Layer JSoup Mysql [Jbolt](http://jbolt.cn) **更多资源请关注公众号:** ![关注公众号](https://images.gitee.com/uploads/images/2019/0611/133805_bbb60ff8_736.jpeg "jfinalxueyuanqrcode[1].jpg")