# reptile-project **Repository Path**: kayze000/reptile-project ## Basic Information - **Project Name**: reptile-project - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-01-13 - **Last Updated**: 2021-01-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 爬虫毕设项目 ## 项目简介 本项目实现python爬取学校网站文档和网页信息保存到数据库中,并在前端页面采用bootstrap模板规范化显示爬取到的文档以及文档的直通车,用户也可以相应在前端页面根据关键字异步地进行查找对应的文档。后端基于Django 采取MTV模式,根据前端需要的数据分模块设计了相应的接口、控制层、数据持久层。 ## 技术栈 **前端**:html,jQuery,bootstrap **后端**:Django **数据库**:Mysql ## 功能模块 1. 爬取数据 ​ 通过`BeautifulSoup`实现对数据爬取,并用`Django`框架的`ORM`模型将爬取到的内容分类保存进数据库。 2. 将数据库的数据展示到页面 运用`Django`框架中的`ORM`模型访问到数据库的内容,然后拼接成一个字典数组返回给前端页面接受处理并显示。 3. 页面的显示 运用`bootstrapTable`让页面的结果显示可根据序号向上或向下排序,或者隐藏标题,隐藏操作隐藏类名等等。 4. 在搜索框中搜索数据 在搜索框输入内容之后会实时异步在页面进行查询操作。 5. 删除操作 ​ 点击页面的删除按钮之后会调用到`Django` 的`ORM`模型清空爬取到的数据库的内容,页面也同步会更新。 ## 运行项目 1. 将项目克隆到本地并用**pycharm**打开 2. 下载项目需要的包:`Django`,`pymysql`,`bs4`,`lxml`,`requests` 3. 将sql文件导入数据库 4. 在 `util/spider.py` ,`djangoProject/settings.py`配置数据库 5. 运行,访问地址:http://127.0.0.1:8000/