# 慧聚股票数据 **Repository Path**: ayrz2010/WisdomGathering-Stock-Data ## Basic Information - **Project Name**: 慧聚股票数据 - **Description**: 本项目包含从1990年至2025年8月的股票、指数相关的多维度、多来源的数据,并持续更新中,涵盖股票的基础信息、行情表现、财务指标及因子分析,指数权重、指数权重等内容,适用于股票研究、数据分析、策略回测等场景。数据按逻辑划分为基础数据、行情数据、财务数据和因子数据四大模块,每个模块包含细分的数据表,详细记录了股票的各类属性及指标。 - **Primary Language**: Python - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2025-08-22 - **Last Updated**: 2025-08-22 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 慧聚股票数据 # 股票数据说明文档 [English](English_README.md) | 简体中文 ## ℹ️ 基础介绍 本项目包含从1990年至2025年8月的股票、指数相关的多维度、多来源的数据,涵盖股票的基础信息、行情表现、财务指标及因子分析,指数权重、指数权重等内容,适用于股票研究、数据分析、策略回测等场景。数据按逻辑划分为**基础数据**、**行情数据**、**财务数据**和**因子数据**四大模块,每个模块包含细分的数据表,详细记录了股票的各类属性及指标。 本项目数据保持**每月**更新,请您持续关注以获得最新数据。 数据字典详见 数据字典.md 文档。 ## 📑 目录 - `daily_basic/` 包含股票的每日基础指标,例如市盈率(pe)、换手率等。 - `fina_indicator/` 包含上市公司的财务指标,包括偿债能力、盈利能力、运营能力等相关指标。 - `index/` 包含股票指数相关数据,如指数代码、名称及每日行情等。 - `stock_daily/` 包含股票的每日行情数据,包括开盘价、收盘价、最高价、最低价和成交量等。 - `stock_daily_hfq/` 包含经过前复权处理的股票每日行情数据(已根据分红和拆股进行调整)。 - `adj_factor.7z` 包含股票价格的复权因子,用于计算调整后的行情数据。 - `dividend.7z` 包含上市公司的分红和拆股数据。 - `fina_mainbz.7z` 包含上市公司的主营业务构成数据,包括不同业务板块的收入等信息。 - `financial_factor.7z` 包含基于财务报表计算的衍生财务因子。 - `stock_balancesheet.7z` 包含上市公司的资产负债表数据,反映资产、负债和股东权益情况。 - `stock_cashflow.7z` 包含上市公司的现金流量表数据,记录经营、投资和筹资活动的现金流入与流出。 - `stock_income.7z` 包含上市公司的利润表数据,包括收入、成本和利润等信息。 ##### 存放于百度网盘的数据(网盘链接见备注部分,部分大体积数据、其他来源数据存储于此): - `quantity_price_factor.tar` 包含量价因子相关数据。 - `锐思日线数据.7z` 包含锐思平台股票日线行情数据。 - `基金.7z` 包含基金相关数据。 - `指数数据.7z` 包含股票指数数据。 - `利润表.7z` 包含上市公司利润表数据。 - `日市值.7z` 包含股票每日市值数据。 - `国泰安指数分股.7z` 包含国泰安平台指数分股相关数据。 - `财产负债表.7z` 包含上市公司资产负债表数据。 - `债券.7z` 包含债券相关数据。 - `锐思指数分级.7z` 包含锐思平台指数分级相关数据。 - `停复牌.7z` 包含股票停复牌相关数据。 - `流通股本.7z` 包含股票流通股本数据。 - `交易所股本.7z` 包含交易所层面股本相关数据。 - `交易日.7z` 包含股票交易日相关数据。 ## 📊 数据模块详情 ### 一、基础数据 基础数据包含股票的静态信息及上市公司基本情况,用于识别股票身份、所属领域及公司核心信息。 #### 1. 基础信息 记录股票的核心标识及基础属性,包括代码、名称、所属市场等。 | 名称 | 类型 | 描述 | | -------- | ---- | -------- | | code | str | 股票代码 | | symbol | str | 股票代码 | | name | str | 股票名称 | | area | str | 地域 | | industry | str | 所属行业 | | ... | ... | ... | #### 2. 上市公司基本信息 记录上市公司的注册信息、管理层、业务范围等细节。 | 名称 | 类型 | 描述 | | ----------- | ----- | --------------- | | code | str | 股票代码 | | com_name | str | 公司全称 | | chairman | str | 法人代表 | | reg_capital | float | 注册资本 (万元) | | setup_date | str | 注册日期 | | province | str | 所在省份 | | ... | ... | ... | ### 二、行情数据 行情数据记录股票的价格波动、交易量及停复牌等动态信息,反映股票的市场表现。 #### 1. 日线行情 每日交易的核心价格及成交量数据,包括开盘价、收盘价、涨跌幅等。 | 名称 | 类型 | 描述 | | ---------- | ----- | -------- | | code | str | 股票代码 | | trade_date | str | 交易日期 | | open | float | 开盘价 | | high | float | 最高价 | | ... | ... | ... | #### 2. 每日指标 每日衍生指标,包括估值指标(市盈率、市净率)、股本指标(总股本、流通市值)等。 | 名称 | 类型 | 描述 | | ------------- | ----- | ----------- | | code | str | 股票代码 | | trade_date | str | 交易日期 | | close | float | 当日收盘价 | | turnover_rate | float | 换手率(%) | | ... | ... | ... | #### 3. 每日停复牌信息 股票停复牌的日期及类型记录。 | 名称 | 类型 | 描述 | | -------------- | ---- | ------------------------------ | | code | str | 代码 | | trade_date | str | 停复牌日期 | | suspend_timing | str | 日内停牌时间段 | | suspend_type | str | 停复牌类型:S - 停牌,R - 复牌 | ### 三、财务数据 财务数据包含上市公司的财务报表及衍生指标,反映公司的经营状况和财务健康度。 #### 1. 利润表 记录公司在特定报告期内的收入、成本、利润等核心盈利数据。 | 名称 | 类型 | 描述 | | ------------- | ----- | -------------------------------------------- | | code | str | 股票代码 | | ann_date | str | 公告日期 | | f_ann_date | str | 实际公告日期 | | end_date | str | 报告期 | | report_type | str | 报告类型 见底部表 | | comp_type | str | 公司类型 (1 一般工商业 2 银行 3 保险 4 证券) | | end_type | str | 报告期类型 | | basic_eps | float | 基本每股收益 | | diluted_eps | float | 稀释每股收益 | | total_revenue | float | 营业总收入 | | revenue | float | 营业收入 | | ... | ... | ... | #### 2. 资产负债表 记录公司在特定日期的资产、负债及股东权益情况,反映公司的财务结构。 | 名称 | 类型 | 描述 | | ----------- | ----- | ---------- | | code | str | 股票代码 | | ann_date | str | 公告日期 | | total_share | float | 期末总股本 | | cap_rese | float | 资本公积金 | | ... | ... | ... | #### 3. 现金流量表 记录公司在特定报告期内的现金流入、流出及净额,反映公司的现金流健康度。 | 名称 | 类型 | 描述 | | ---------- | ----- | -------- | | code | str | 股票代码 | | ann_date | str | 公告日期 | | net_profit | float | 净利润 | | finan_exp | float | 财务费用 | | ... | ... | ... | #### 4. 分红送股 公司分红、送转股的方案及实施进度。 | 名称 | 类型 | 描述 | | ----------- | ----- | ---------------- | | code | str | 股票代码 | | end_date | str | 分红年度 | | stk_bo_rate | float | 每股送股比例 | | stk_co_rate | float | 每股转增比例 | | cash_div | float | 每股分红(税后) | | ... | ... | ... | #### 5. 财务指标数据 基于财务报表计算的衍生指标,包括盈利能力、偿债能力、成长能力等。 | 名称 | 类型 | 描述 | | ---------------- | ----- | -------------- | | code | str | 股票代码 | | ann_date | str | 公告日期 | | end_date | str | 报告期 | | eps | float | 基本每股收益 | | dt_eps | float | 稀释每股收益 | | total_revenue_ps | float | 每股营业总收入 | | ... | ... | ... | #### 6. 主营业务构成 公司主营业务的收入、成本及利润分布。 | 名称 | 类型 | 描述 | | --------- | ----- | ----------------- | | code | str | 股票代码 | | end_date | str | 报告期 | | bz_item | str | 主营业务来源 | | bz_sales | float | 主营业务收入 (元) | | bz_profit | float | 主营业务利润 (元) | | bz_cost | float | 主营业务成本 (元) | ### 四、因子数据 因子数据是基于价格、成交量及财务数据计算的衍生指标,用于量化分析和策略构建。 #### 1. 价量因子 基于价格和成交量计算的技术指标,反映市场交易情绪和趋势。 | 名称 | 类型 | 描述 | 计算公式 | | ---------- | ------- | -------------------- | ------------------------------------------------- | | code | VARCHAR | 股票代码 | | | trade_date | DATE | 交易日期 | | | boll_up | FLOAT | 上轨线(布林线)指标 | (MA (CLOSE,M)+2*STD (CLOSE,M)) / 今日收盘价;M=20 | | boll_down | FLOAT | 下轨线(布林线)指标 | (MA (CLOSE,M)-2*STD (CLOSE,M)) / 今日收盘价;M=20 | | EMA5 | FLOAT | 5 日指数移动均线 | 5 日指数移动均线 / 今日收盘价 | | ... | ... | ... | ... | #### 2. 财务因子 基于财务数据计算的指标,反映公司财务质量和运营效率。 | 名称 | 类型 | 描述 | 计算公式 | | --------------------------------------- | ------- | ---------------------- | --------------------------------------------------------- | | code | VARCHAR | 股票代码 | | | end_date | DATE | 报告期末日期 | | | f_ann_date | DATE | 财务报告公告日期 | | | net_profit_to_total_operate_revenue_ttm | FLOAT | 净利润与营业总收入之比 | 净利润与营业总收入之比 = 净利润(TTM)/ 营业总收入(TTM) | | ... | ... | ... | ... | ## 📝 备注 - 数据存放此在github仓库中,财务因子数据、多渠道来源数据等较大文件存放于百度网盘中。链接: https://pan.baidu.com/s/1eyeHp6ftDZ4M9lcFurZkgQ 提取码: hpa6 - 数据字典详见 [数据字典](数据字典.md)。 - 英文文档见[English](English_README.md)