软件介绍
Umi-OCR文字识别工具是一个免费和开源的应用程序,专为处理大量本地图片而设。无论您是需要在数百/数千张图片中提取文本,并将其导出至内置面板或txt文件,还是在繁杂的视觉内容中寻找特定文本,Umi-OCR都能做到。
其中一项突出的功能是它可以指定忽略某些区域内的文字,这一功能在处理带有水印的视频截图或者包含UI/按钮的游戏截图时尤其有用。为了提取出仅包含字幕区域的文本,而无视其他元素如水印和UI文本,开发Umi-OCR的目标正是为此。
尤其值得一提的是,Umi-OCR体现了出色的性能,很好地适用于处理Galgame的屏幕截图,并批量提取其中的对白。当你需要整理、查找众多影视和游戏截图的时候,使用Umi-OCR去提取出文字,再利用简单的Ctrl F就可以找到你需要的内容,这是极其高效的方法。Umi-OCR的开发初衷就是为了铸造这回快捷、精确的文字识别工具。
软件特点
开源与免费:该项目提供的全部代码都是开源的,同时使用过程中没有任何费用。
即插即用:只需解压,无需安装任何其他软件或网络支持,即可离线运行。
批量处理:它允许批量导入图片进行处理,同时,处理结果可以保存为本地的 txt、md或jsonl等多种格式的文件。你甚至能即时截屏识别。
高效运转:该项目采用了PaddleOCR-json C++识别引擎,只要你的电脑性能足够好,它通常会比在线OCR服务运行得更快。
准确无误:默认使用的是PPOCR-v3模型库。它不仅能准确地识别常规文字,甚至对于诸如手写、方向不正、背景混乱等复杂情况也有相当高的识别率。对于不需要的区域,如水印,可以设定为忽略区域,通过设置文块后处理合并排版段落,可以得到规整的文本。
简单上手
准备
下载压缩包并解压全部文件即可。
截图识别
点击截图按钮或自定义快捷键,唤起截图识别。
还可以设置截图后生成一个预览窗口。预览窗口可以被钉在屏幕顶层,或调为半透明,方便对比查看。
粘贴图片到软件
在任何地方(如文件管理器,网页,微信)复制图片,软件上点击粘贴按钮或快捷键,自动识别。
批量识别本地图片文件
将图片或文件夹拖进软件,批量转换文字。也可以点击按钮打开浏览窗口导入。
识别结果将保存到本地。可选生成纯文本txt文件、带链接Markdown文件、原始信息jsonl文件等不同格式。可配置任务完成后执行关机/待机。
更新日志
https://github.com/hiroi-sora/Umi-OCR#%E6%9B%B4%E6%96%B0%E6%97%A5%E5%BF%97