# 识认物语

**Repository Path**: xinyutech/recognizing-object-language

## Basic Information

- **Project Name**: 识认物语
- **Description**: 用来进行识别，目前暂时只支持文字识别，后续将开放车牌识别等服务。
- **Primary Language**: Python
- **License**: GPL-2.0
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2023-05-09
- **Last Updated**: 2023-07-27

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

#识认物语

#### 介绍
项目根据开源项目进行学习，为本人第一次对Python项目进行探索。
为什么起名字叫识认物语，是因为是识别在既往的OpenCV 里面只做了简单的识别。
大学时代也不过只通过调接口的方式进行了安卓OCR的编写。
有幸在社区认识了Python相关的开发人员，遂通过搭建环境的方式以及修改错误的方式进行编写
总共学习Python投入了两本Python书籍
400集编程资料。
项目的扩充灵感来自于  嵌入式编程linux的内核裁剪与 QT图形化编程，因此在社区借鉴了前辈的框架
本项目不用于商业用途，纯粹是对图像识别与QT图形化的编写。


### 功能特性
- 文本区域检测+文字识别
- 文本区域可视化
- 文字内容列表
- 图像、文件夹加载
- 图像滚轮缩放查看
- 选取文本识别结果

#### 软件架构
- GUI 基于 [PyQt5](https://pypi.org/project/PyQt5/) + [labelme](https://github.com/wkentaro/labelme) 实现
- OCR 基于 [PaddleOCR](https://gitee.com/paddlepaddle/PaddleOCR/) 实现
- icons 来源于 [material-design-icons](https://github.com/google/material-design-icons)

#### 安装步骤
PaddleOCR的安装可参考：
https://blog.csdn.net/Bit_Coders/article/details/121561632

#### 使用说明
运行以下命令，即可启动软件。
```shell
python main.py
```
使用流程：
1. 打开图片 
2. 选择语言模型（默认ch中文）
3. 选择文本检测+识别
4. 点击开始按钮
5. 检测完的文本区域会自动画框，并在右侧识别结果列表中显示。

#### TODO List
- 绘制区域、编辑区域
- 增加自主框选
- 增加版面分析
- 增加自动翻译
- 增加程序打包
- 增加不同格式保存