Umi-OCR 是一款免费且开源的批量离线 OCR 软件,适用于 Windows10 和 Windows11 平台。
它能够批量识别普通图片并提取文字内容,还支持忽略指定区域的功能,例如可以屏蔽视频右上角的水印和游戏的 UI 内容。
Umi-OCR 软件自带简体中文和英文识别库。
配套有多国语言识别扩展包,可导入繁中、日文、韩文、俄文、德文和法文等识别库,请按需下载。
该软件由果核网友@奔跑的小蚂蚁 推荐。
软件特点:
免费:项目代码完全开源,无需付费。
方便:解压即可使用,离线运行无需网络连接。
批量:支持批量处理图片,并将结果保存为本地的 txt、md 或 jsonl 格式文件。也可即时截屏进行文字识别。
高效:采用 PaddleOCR-json C++ 识别引擎,在电脑性能足够的情况下通常比在线 OCR 服务更快。
精准:默认使用 PPOCR-v3 模型库。除了常规文字外,对手写文字、倾斜文字以及复杂背景的文字也有较好的辨识率。用户还可以设置忽略区域以排除水印,并对文本块进行后处理以优化排版和段落整理。
更新日志:
修复了 Windows7 和低端 CPU 无法进行文档识别的问题。
新增功能包括允许在批量文档识别时指定忽略区域的页数范围,并支持通过命令行--path参数传入多个图片或文件夹。
总结:Umi-OCR 是一个功能强大且易于使用的 OCR 工具,特别适合需要快速高效地从大量图片中提取文本内容的情况。