# 链家新房数据爬取 **Repository Path**: xudaile/gitee_lianjia_house ## Basic Information - **Project Name**: 链家新房数据爬取 - **Description**: 针对链家网数据爬取,主要获取新房数据。 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 10 - **Forks**: 1 - **Created**: 2019-05-09 - **Last Updated**: 2025-01-21 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 链家新房数据爬取 #### 介绍 针对链家网数据爬取,主要获取新房数据。 #### 爬虫说明 1.根据链接爬取列表数据(如:名称,详细链接)。
2.根据详细链接获取详情数据。(如:户数,开盘时间,地址,坐标,等)
3.保存数据到数据库。
4.导出csv。
### 技术应用 1.request 原生请求。
2.psycopg2 连接数据库保存数据。
3.BeautifulSoup 定位页面元素信息。
4.ThreadPoolExecutor 多线程并发请求
5.csv 导出csv
### 示例图

链家新房网页图

导出csv图