离线开源OCR图片转文字识别软件 | Umi OCR v2.1.4
利用OCR技术,我们提供完全离线的图片转文字识别软件。支持截屏或批量导入图片,适用于多国语言,可合并段落和识别竖排文字。此外,软件还能智能排除水印区域,提取干净的文本。基于PaddleOCR技术,保证高效准确的识别。2.1.4 主要更新:
修复:引擎原始输出项的”text”为空时,导致文本分析越界的错误。 (#625)
新增UI语言:葡萄牙语 Português 。译者:@杨鹏
PaddleOCR 插件相关:
修复:布尔类型选项不生效的问题。
修复: 繁体中文 配置文件错误的问题。
优化:调整默认线程/内存限制,默认内存占用不超过系统总内存的一半。
优化:调整识别语言库结构,精简不必要的文件。
Linux 版本相关:
优化:glibc 依赖降级至 2.31 ,兼容 Debian-11 等发行版。
修复:Docker 部署 在部分旧系统中报错 ‘code’: 803 的问题。(#621)
软件特点免费:本项目所有代码开源,完全免费。
方便:解压即用,离线运行,无需网络。
批量:可批量导入处理图片,结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。
高效:采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够,通常比在线OCR服务更快。
精准:默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落,得到规整的文本。下载说明以下的不同版本,仅OCR引擎插件不同,其它功能完全一致。均支持 win7 x64 及以上的系统。
附带 简中/繁中/英/日/韩/俄 多国语言识别库。
Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器)
Rapid 引擎插件版
(速度稍慢,内存占用低,兼容好,适合低配机器)
下载地址:**** 本内容需购买 ****
识别的挺快,主要是想试一下竖式识别,没找到手动切换的,找了几个竖式稿件,竖式纸张竖式文字可以正确识别,横式纸张竖式文字按横排识别了,没有找到手动切换横竖排文字的地方,一直在用天若离线版识别文字,大多都是横式的,竖式的用千百图片识别ocr,相较这个竖式识别,这个还是更简洁方便,如能添加一下手动切换横竖排选项解决这个自动判断横竖文字问题就完美了。感谢分享。 看起来不错,有时间下载试试 有没有翻译功能的,
页:
[1]