# filter_pdf_copy **Repository Path**: breath57/filter_pdf_copy ## Basic Information - **Project Name**: filter_pdf_copy - **Description**: 功能: PDF内容和网页上复制的文本,可自动过滤冗余换行符,并自动全角转半角。背景: 复制PDF上面的文字,PDF的多行复制会产生冗余的换行。当复制的内容非常多,将耗费大量时间在手动删除冗余换行上,并且半角的英文字母和数字等符号在PDF上复制会变成全角符号,也需要手动重新编辑。 - **Primary Language**: Python - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 2 - **Forks**: 0 - **Created**: 2022-07-28 - **Last Updated**: 2023-12-02 ## Categories & Tags **Categories**: Uncategorized **Tags**: pdf, PDF复制, Python, 科研工具 ## README ## 背景 当复制PDF上面的文字,PDF的多行复制会产生冗余的换行。当复制的内容非常多,将耗费大量时间在手动删除冗余换行上,并且半角的英文字母和数字等符号在PDF上复制会变成全角符号,也需要手动重新编辑。并且空白字符的干扰较多,符号无法统一。 ## 主要功能 1. 自动过滤冗余换行符。 2. 自动纠正全角半角。 3. 自动识别中英文内容,过滤多余的空格。 4. 自动统一中英文符号。 5. 自动识别复制图片,文件等操作,不会使此类操作受到影响。 例如: ```text 我 是a student, and 学生,此 刻我非常的 开心。 哈哈哈 ``` 处理后: ```text 我是a student,and学生,此刻我非常的开心。哈哈哈 ``` ## 使用介绍 ### 程序有两个状态: 1. 打开状态:开启程序的功能 2. 关闭状态:暂时关闭程序的功能 ### 程序有3种符号模式: 1. 自动识别处理(包含中文,统一转换为中文符号,否则转换为英文符号) 2. 英文符号(自动修正所有符号为英文符号) 3. 中文符号(自动修正所有符号为中文符号) ### 相关操作说明: * 切换状态:按 `F7` 键(在任何界面下均可使用) * 切换符号模式:按 `F8` 键(在任何界面下均可使用) * 退出程序: 1. `Ctrl + F7`; 或者 2.直接关闭窗口即可 ## 获取程序 ### 下载 1. 下载程序 > [点击下载程序](https://gitee.com/breath57/filter_pdf_copy/raw/master/dist/filter_pdf_copy-v2.1.exe) 2. 双击打开即可 --- > 😁【创作不易,如果对你有帮助到,可以帮忙点一个start,目前就自己一个start好可怜】😥 > 如果只有Github账号的可进入这支持一下:[https://github.com/breath57/filter_pdf_copy](https://github.com/breath57/filter_pdf_copy) ### 自行打包 1. 拉取源码 ```sh git clone https://gitee.com/breath57/filter_pdf_copy ``` 1. 进入项目 ```sh cd filter_pdf_copy ``` 1. 打包 ```sh pyinstaller -F filter_pdf_copy.py ``` 最终可在`dist`目录下看到`filter_pdf_copy.exe`程序