# deep study work **Repository Path**: wang-zhenwz/deep-study-work ## Basic Information - **Project Name**: deep study work - **Description**: No description available - **Primary Language**: Unknown - **License**: MulanPSL-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-05-22 - **Last Updated**: 2025-05-26 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 基于YOLOv5s算法的口罩佩戴检测研究 ## 一、项目简介 本项目提出了一种基于YOLOv5s算法的口罩佩戴检测方法,旨在解决人工检查方式效率低下的问题。通过改进模型训练策略,提升了对“手捂嘴”等欺骗手段的检测准确率,并在验证集上达到了90.24%的准确率。项目最终部署至本地,开发了图形界面,实现了实时检测功能。 --- ## 二、项目背景 COVID-19主要通过飞沫传播,正确佩戴口罩是有效防控手段之一。然而,现有智能检测系统常以嘴部遮挡为指标,导致“手捂嘴”行为被误判为佩戴口罩。本项目通过优化YOLOv5s模型,显著提升了检测准确率。 --- ## 三、技术实现 ### 模型选择 - **YOLOv5s**:轻量化模型,适合实时检测,速度快且精度高。 - **网络结构**:分为输入端、Backbone、Neck和Prediction四部分。 ### 数据集 - **初始数据**:1163张图片(513张佩戴口罩,650张未佩戴)。 - **数据扩充**:添加181张“手捂嘴”图片,最终形成2000张图片的数据集(800张佩戴,1200张未佩戴)。 - **测试集**:41张真实场景照片。 ### 训练优化 - **参数设置**: - 学习率(Lr0):0.01 - 权重衰减(Weigh_decay):0.0005 - 预热轮次(Warmup_epochs):3.0 - **策略**: - 加权图像策略:提升难样本的权重。 - Label-smoothing:增强模型对错误标注的鲁棒性。 - 早停机制:防止过拟合。 ### 实验结果 - 改进后模型准确率:90.24%(较原始模型提升5.71%)。 - 实时检测帧率:稳定在100FPS以上。 - ![输入图片说明](%E5%9B%BE%E7%89%871.png) --- ## 四、部署与使用 ### 本地部署 - **环境配置**: - 操作系统:Windows10 家庭中文版 - GPU:Nvidia GeForce RTX3060 - 框架:PyTorch + CUDA 11.6 - 基础环境:pip install -r requirements.txt # 包含(albumentations==1.3.0 coremltools==6.1 Flask==2.2.2 matplotlib==3.5.1 numpy==1.22.2 onnx==1.13.0 onnxruntime==1.13.1 onnxsim==0.4.10 opencv_python==4.5.5.62 pafy==0.5.5 pandas==1.4.1 Pillow==9.3.0 protobuf==4.21.12 pycocotools==2.0.6 PyQt5==5.15.7 PyYAML==6.0 requests==2.27.1 scipy==1.8.0 seaborn==0.11.2 setuptools==58.0.4 tensorflow==2.11.0 tensorflowjs==4.1.0 thop==0.1.1.post2209072238 torch==1.10.2 torchvision==0.11.3 tqdm==4.62.3) - **功能**: - 图形界面(PyQt5开发)支持实时摄像头检测和本地文件检测。 - 新增画面保存功能(基于OpenCV的VideoWriter)。 - ![输入图片说明](%E5%9B%BE%E7%89%872.png) ### 检测结果 - 单人检测 - ![输入图片说明](%E5%9B%BE%E7%89%873.png) - 手捂嘴检测 - ![输入图片说明](%E5%9B%BE%E7%89%874.png) - 多人检测 - ![输入图片说明](%E5%9B%BE%E7%89%875.png) ## 五、项目亮点 1. **高准确率**:针对“手捂嘴”行为优化,准确率提升至90.24%。 2. **实时性强**:检测帧率超过100FPS,满足实时需求。 3. **易用性**:提供图形界面,操作简便。 4. **鲁棒性**:通过数据增强和训练策略提升模型泛化能力。 ---