# reptile-project

**Repository Path**: kayze000/reptile-project

## Basic Information

- **Project Name**: reptile-project
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2021-01-13
- **Last Updated**: 2021-01-19

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# 爬虫毕设项目

## 项目简介

本项目实现python爬取学校网站文档和网页信息保存到数据库中，并在前端页面采用bootstrap模板规范化显示爬取到的文档以及文档的直通车，用户也可以相应在前端页面根据关键字异步地进行查找对应的文档。后端基于Django 采取MTV模式，根据前端需要的数据分模块设计了相应的接口、控制层、数据持久层。

## 技术栈

**前端**：html,jQuery,bootstrap

**后端**：Django

**数据库**：Mysql

## 功能模块

1. 爬取数据

​	通过`BeautifulSoup`实现对数据爬取，并用`Django`框架的`ORM`模型将爬取到的内容分类保存进数据库。

2. 将数据库的数据展示到页面

   运用`Django`框架中的`ORM`模型访问到数据库的内容，然后拼接成一个字典数组返回给前端页面接受处理并显示。

3. 页面的显示

   运用`bootstrapTable`让页面的结果显示可根据序号向上或向下排序，或者隐藏标题，隐藏操作隐藏类名等等。

4. 在搜索框中搜索数据

   在搜索框输入内容之后会实时异步在页面进行查询操作。

5. 删除操作

​		点击页面的删除按钮之后会调用到`Django` 的`ORM`模型清空爬取到的数据库的内容，页面也同步会更新。

## 运行项目

1. 将项目克隆到本地并用**pycharm**打开
2. 下载项目需要的包：`Django`，`pymysql`，`bs4`，`lxml`，`requests`
3. 将sql文件导入数据库
4. 在 `util/spider.py` ,`djangoProject/settings.py`配置数据库
5. 运行，访问地址：http://127.0.0.1:8000/