利用OCR技术,我们提供完全离线的图片转文字识别软件。支持截屏或批量导入图片,适用于多国语言,可合并段落和识别竖排文字。此外,软件还能智能排除水印区域,提取干净的文本。基于PaddleOCR技术,保证高效准确的识别。
更新日志v2.1.4 主要更新:
修复:引擎原始输出项的”text”为空时,导致文本分析越界的错误。 (#625)
新增UI语言:葡萄牙语 Português 。译者:@杨鹏
PaddleOCR 插件相关:
修复:布尔类型选项不生效的问题。
修复: 繁体中文 配置文件错误的问题。
优化:调整默认线程/内存限制,默认内存占用不超过系统总内存的一半。
优化:调整识别语言库结构,精简不必要的文件。
Linux 版本相关:
优化:glibc 依赖降级至 2.31 ,兼容 Debian-11 等发行版。
修复:Docker 部署 在部分旧系统中报错 ‘code’: 803 的问题。(#621) 软件特点免费:本项目所有代码开源,完全免费。
方便:解压即用,离线运行,无需网络。
批量:可批量导入处理图片,结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。
高效:采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够,通常比在线OCR服务更快。
精准:默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落,得到规整的文本。 下载说明以下的不同版本,仅OCR引擎插件不同,其它功能完全一致。均支持 win7 x64 及以上的系统。
附带 简中/繁中/英/日/韩/俄 多国语言识别库。
Paddle 引擎插件版
(性能好,速度快,占用率高,适合高配机器)
Rapid 引擎插件版
(速度稍慢,内存占用低,兼容好,适合低配机器)
|