软件介绍
Umi-OCR 是一款基于 深度学习 的 文字识别工具,支持从图片中提取文字并转换为可编辑文本。它提供两个版本,适应不同电脑配置,并支持批量处理和截图识别,完全免费且无需联网。
Umi-OCR 功能特点
Umi-OCR 利用计算机视觉技术,能快速识别图像中的文字,包括手机拍摄、扫描文件等来源。它的识别引擎基于 PaddleOCR,准确度高,适用于多种场景。
软件提供 Paddle 和 Rapid 两个版本:Paddle 版性能更强但占用资源较多,Rapid 版适合配置较低的电脑。下载后解压即可使用,无需安装。
Paddle 版功能
Paddle 版:Umi-OCR 批量图片转文字 v2.1.2 免费绿色版
完全免费:代码开源,无任何收费功能。
离线运行:无需联网,解压后直接使用。
批量处理:支持同时导入多张图片,识别结果可保存为 txt、md 或 jsonl 格式,也能直接截图识别。
高效识别:采用 C++ 引擎,识别速度比在线 OCR 更快。
精准度高:默认使用 PPOCR-v3 模型,能识别手写文字、倾斜文本和复杂背景,还能过滤水印并优化段落排版。
使用说明
简单操作:截图或批量导入图片即可识别文字。
排版优化:自动合并段落内的文字。
忽略区域:可设置排除水印等干扰内容。
多语言支持:可扩展更多 OCR 语言模型。
翻译联动:识别后可直接触发翻译软件。
常见问题:解决引擎启动失败或多屏幕截图异常。
安装与使用
第1步:从 GitHub 下载公式插件 win7_x64_Pix2Text(下载地址:https://simpletex.cn)。
第2步:解压插件,放入 UmiOCR-data\plugins 文件夹。
第3步:打开 Umi-OCR,进入全局设置→文字识别→切换接口为 Pix2Text→点击应用修改。
建议关闭“启用文字识别”选项,以提高公式识别准确率。
识别后的公式会生成 LaTeX 代码,复制到相关网站即可渲染成数学公式。
注:Pix2Text 插件仍在优化中,未来 Umi-OCR 将支持独立的公式识别功能,并增加 LaTeX 实时预览。
最新更新
新增功能:批量任务支持暂停和恢复,文档可导出为纯文本 PDF。
接口优化:HTTP OCR 和二维码接口支持更多参数设置。
命令行增强:支持指定截图范围。
问题修复:优化文档内容提取和文件保存逻辑。
性能提升:批量处理大文件更流畅,UI 布局更美观。
用户评论