# study_project_collection **Repository Path**: Bigdata_2013_admin/study_project_collection ## Basic Information - **Project Name**: study_project_collection - **Description**: 日常学习记录集合,记录学习过程及代码提交 - **Primary Language**: Python - **License**: MulanPSL-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2022-07-02 - **Last Updated**: 2022-08-07 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 爬虫 #### 介绍 爬虫练习,爬取快手短视频,壁纸 网站高清壁纸,表情包 #### 软件架构 使用到的类库有如下: requests, os, parsel, re, json #### 安装教程 1. pip install requests . . . #### 使用说明 ``` 1.确定需求 2.抓取快手短视频 3.确定数据来源 确定视频所在连接地址 静态页面:右键--查看源代码---搜索,发现有内容(小说网站) 动态页面:右键---查看源代码---搜索,发现没有视频(视频网站) 右键--点击检查-----network----刷新网页---(包含了我们页面所有的视频) 4.代码实现过程 发送网络请求 获取数据 解析数据 发送网络请求:请求每个视频地址 获取视频二进制数 5.保存二进制文件 ``` #### 参与贡献 1. https://gitee.com/Bigdata_2013/pachong #### 代码具体实现如下 ![输入图片说明](img/image.png) ![输入图片说明](img/image2.png) ![输入图片说明](img/image3.png) ![输入图片说明](img/image5.png)