Umi-OCR是一款开源、免费、离线的文字识别工具,基于先进的OCR技术开发,致力于为用户提供便捷、高效的文字识别服务。它采用高效的离线OCR引擎,内置多种语言识别库,支持多种格式的图片和文档识别。
![图片[1]-Umi-OCR文字识别工具(离线OCR软件) v2.1.5 中文绿色版-五九软件库](https://ing.5909.net/wp-content/uploads/2025/03/20250326104525231-ba9c092511acab6.png)
软件功能
图片文字识别:支持多种格式的图片(如JPEG、PNG等),可以快速准确地提取其中的文字,还支持截图识别和批量识别。
PDF文件识别:能够从PDF扫描件中提取文本,并可将PDF转换为双层可搜索PDF,支持保留原有排版格式。
二维码功能:支持扫描二维码获取信息,也可以生成二维码图片。
公式识别:具备数学公式识别功能,可帮助用户快速提取和编辑公式内容。
文本后处理:预设多种排版解析方案,可以整理OCR结果的排版和顺序,优化输出格式。
忽略区域功能:用户可以设置忽略图片中不需要识别的区域,如水印或logo。
命令行和HTTP接口调用:支持命令行和HTTP接口调用,方便与其他软件或工具集成。
软件特点
开源免费:所有代码开源,用户可以免费使用和修改。
离线使用:无需联网即可进行OCR识别,保护用户隐私。
高效识别:采用高效的离线OCR引擎,识别速度快。
多语言支持:内置多国语言识别库,支持多国语言的文字识别,界面也支持多语言切换。
灵活调用:支持命令行、HTTP接口等多种外部调用方式。
批量处理:支持批量导入图片进行识别,无数量上限。
精准识别:对复杂场景(如手写、方向不正、杂乱背景等)也有不错的识别率。
更新日志
v2.1.5 主要更新:
新增:日志机制。在命令行中启动 Umi-OCR 可查看实时日志。高于指定级别(默认为ERROR)的日志被保存到 Umi-OCR/UmiOCR-data/logs 目录中,保存级别可以在全局设置标签页中更改。
新增:大部分标签页能手动切换左右/上下双栏模式。 (#789)
新增:Esc键隐藏主窗口。 (#652)
新增:调整二维码生成相关参数后,自动刷新二维码生成。 (#690)
新增:命令行指令 –reload ,用于重新加载配置文件。 👉 文档
修复:文档识别提取PDF自带的文本内容时,未考虑页面旋转的影响。 (#785)
修复:文档识别生成单层PDF时,未写入原PDF自带的文本内容。
修复:OCR结果展示列表的一些显示Bug和鼠标划选Bug。
修复:调整标签页顺序或删除标签页后,未及时保存顺序信息。
修复:HTTP接口 /api/doc/download 参数 ignore_blank 的错误。
修复:Linux版本截图时,系统任务栏推移顶层窗口,导致截图位置偏移。 (#778)
修复:Linux版本截图后,主窗口的位置与操作前不一致。
优化:图片/文档的异步加载机制。现在可以流畅地加载含有数万个子文件的文件夹,且能预览加载进度。 (#710)
Windows 版本更新第三方依赖库:PyMuPDF 1.24.11 ,fontTools 4.56.0 ,Pillow 10.4.0 ,psutil 10.4.0 ,pynput 1.8.0 ,zxing-cpp 2.3.0
新增UI语言:俄语 Português ,译者:Вячеслав Анатольевич Малышев、Muhammadyusuf Kurbonov。泰米尔语 தமிழ் ,译者:தமிழ்நேரம்。
下载说明
以下的不同版本,仅OCR引擎插件不同,其它功能完全一致。均支持 win7 x64 及以上的系统。
附带 简中/繁中/英/日/韩/俄 多国语言识别库。
Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器)
Rapid 引擎插件版
(速度稍慢,内存占用低,兼容好,适合低配机器)
暂无评论内容