# 机器学习经典算法练习-鲍鱼年龄预测 **Repository Path**: wx114/age-prediction-of-abalone ## Basic Information - **Project Name**: 机器学习经典算法练习-鲍鱼年龄预测 - **Description**: 基于UCI的Abalone数据集,该数据集详细记录了鲍鱼的性别、尺寸、重量等8个特征。通过本项目,学会如何利用这些特征,通过经典机器学习算法来预测鲍鱼的年龄。算法实践涵盖包含数据处理、模型训练与评估等步骤,助你提升实战能力。 - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 2 - **Forks**: 1 - **Created**: 2024-06-05 - **Last Updated**: 2025-05-18 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 机器学习经典算法练习-鲍鱼年龄预测 #### 介绍 基于UCI的Abalone数据集,该数据集详细记录了鲍鱼的性别、尺寸、重量等8个特征。通过本项目,学会如何利用这些特征,通过经典机器学习算法来预测鲍鱼的年龄。算法实践涵盖包含数据处理、模型训练与评估等步骤,助你提升实战能力。 #### 数据集介绍 UCI的Abalone数据集是用于机器学习回归任务的经典数据集,它主要关注于根据鲍鱼的物理特征来预测其年龄。以下是关于该数据集的详细介绍: 1. 数据集来源 - Abalone数据集来自于UCI(University of California, Irvine)机器学习存储库,是一个公开的、用于教学和研究的资源。 2. 数据集目标 - 数据集的主要目标是基于鲍鱼的物理度量(如长度、直径、高度等)来预测鲍鱼的年龄。 3. 特征属性 - 数据集中包含了多个特征属性,如: - 性别(Sex):包括雄性(M)、雌性(F)和未知(I) - 长度(Length):最长壳长,单位毫米 - 直径(Diameter):垂直于长度的直径,单位毫米 - 高度(Height):带肉的壳高,单位毫米 - 整体重量(Whole weight):整体鲍鱼重量,单位克 - 去壳重量(Shucked weight):肉质重量,单位克 - 内脏重量(Viscera weight):内脏重量(放血后),单位克 - 壳重量(Shell weight):干燥后的壳重,单位克 4. 目标属性 - 数据集的目标属性是鲍鱼的年龄,通常以鲍鱼环(鲍鱼壳上的生长环)数量表示,加上1.5即为实际年龄(以年为单位)。 5. 数据量 - 数据集总共包含**4177条**数据记录。 **标准化与归一化对模型影响** 1. 标准化与归一化对有的数据集有用,可以提升模型性能; 2. 但对我们这个项目的数据集而言,标准化与归一化不能提升模型性能; ![image-1](markdown/image-1.png) #### 安装教程 1. pip install jupyter 2. pip install numpy pandas matplotlib 3. pip install scikit-learn #### 使用说明 1. 数据集在dataset中 2. 找到source_code文件夹,在此路径中运行jupyter notebook就行