# 识认物语 **Repository Path**: xinyutech/recognizing-object-language ## Basic Information - **Project Name**: 识认物语 - **Description**: 用来进行识别,目前暂时只支持文字识别,后续将开放车牌识别等服务。 - **Primary Language**: Python - **License**: GPL-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2023-05-09 - **Last Updated**: 2023-07-27 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README #识认物语 #### 介绍 项目根据开源项目进行学习,为本人第一次对Python项目进行探索。 为什么起名字叫识认物语,是因为是识别在既往的OpenCV 里面只做了简单的识别。 大学时代也不过只通过调接口的方式进行了安卓OCR的编写。 有幸在社区认识了Python相关的开发人员,遂通过搭建环境的方式以及修改错误的方式进行编写 总共学习Python投入了两本Python书籍 400集编程资料。 项目的扩充灵感来自于 嵌入式编程linux的内核裁剪与 QT图形化编程,因此在社区借鉴了前辈的框架 本项目不用于商业用途,纯粹是对图像识别与QT图形化的编写。 ### 功能特性 - 文本区域检测+文字识别 - 文本区域可视化 - 文字内容列表 - 图像、文件夹加载 - 图像滚轮缩放查看 - 选取文本识别结果 #### 软件架构 - GUI 基于 [PyQt5](https://pypi.org/project/PyQt5/) + [labelme](https://github.com/wkentaro/labelme) 实现 - OCR 基于 [PaddleOCR](https://gitee.com/paddlepaddle/PaddleOCR/) 实现 - icons 来源于 [material-design-icons](https://github.com/google/material-design-icons) #### 安装步骤 PaddleOCR的安装可参考: https://blog.csdn.net/Bit_Coders/article/details/121561632 #### 使用说明 运行以下命令,即可启动软件。 ```shell python main.py ``` 使用流程: 1. 打开图片 2. 选择语言模型(默认ch中文) 3. 选择文本检测+识别 4. 点击开始按钮 5. 检测完的文本区域会自动画框,并在右侧识别结果列表中显示。 #### TODO List - 绘制区域、编辑区域 - 增加自主框选 - 增加版面分析 - 增加自动翻译 - 增加程序打包 - 增加不同格式保存