# 链家新房数据爬取
**Repository Path**: xudaile/gitee_lianjia_house
## Basic Information
- **Project Name**: 链家新房数据爬取
- **Description**: 针对链家网数据爬取,主要获取新房数据。
- **Primary Language**: Python
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 10
- **Forks**: 1
- **Created**: 2019-05-09
- **Last Updated**: 2025-01-21
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# 链家新房数据爬取
#### 介绍
针对链家网数据爬取,主要获取新房数据。
#### 爬虫说明
1.根据链接爬取列表数据(如:名称,详细链接)。
2.根据详细链接获取详情数据。(如:户数,开盘时间,地址,坐标,等)
3.保存数据到数据库。
4.导出csv。
### 技术应用
1.request 原生请求。
2.psycopg2 连接数据库保存数据。
3.BeautifulSoup 定位页面元素信息。
4.ThreadPoolExecutor 多线程并发请求
5.csv 导出csv
### 示例图
链家新房网页图
导出csv图