PearOCR是一款免费无限制的在线 OCR 工具,最大特色是使用自己的 OCR 识别引擎,全部识别过程在浏览器本地完成,不受限于需要付费的大厂 API 服务。
特征
完全免费
市面上提供OCR的软件大部分有各种限制(识别次数或者文件大小),需要收费才能解除限制,而PearOCR的识别完全免费,没有次数和文件大小限制。
本地运算
市面上的OCR软件大部分是利用大公司的API进行识别,需要把图片上传到服务器再返回识别结果,这个过程有可能导致个人数据的泄露和滥用。PearOCR基于自研的轻量化识别引擎,整个过程都在本地运算,不会把图片或者识别结果上传,从原理上保护数据安全。
优化排版
PearOCR的识别结果采用和原图文本相同位置的排版,便于进行文字的提取和分析
无需下载
PearOCR所有过程均在网页端完成,无需下载任何软件,点开即用
PDF导出
提供导出PDF的功能,把图片和文本都集在同一个PDF中,方便存档和对照,同时提供了不同的PDF排版选项
加载图像
PearOCR提供了多种加载图像的方法,尽可能地简化使用过程。支持同时选取/拖拽多张图片进行识别。
通过对话框选取本地图像
点击[本地图片]按钮,从弹出的对话框中选择要识别的图片 本地图片
拖动文件进行识别
除了通过打开选择对话框,还可以直接把文件拖到识别框内进行识别 拖拽图片
剪贴板加载
PearOCR可以直接读取剪贴板的图像,配合截图工具(如微信,QQ),截图完直接识别,无需另存为本地文件
除了点击按钮,也可以通过Ctrl+V快捷键加载剪贴板中的图像
获取识别结果
查看识别结果
PearOCR提供了三种方式查看识别的结果文本。
带位置信息的文本(推荐)
按照原图中出现文本的位置进行排版,这种方式能十分方便地从杂乱的文本中提取所需信息。
为了方便对照,PearOCR提供了图片衬底的功能,能在图片上面对应位置显示文本,更方便地查看识别结果
纯文本
把识别的文本位置从上到下排列组合成一段文本,这种方式适用于规则的从上到下排版的文本段。
表格
识别的结果以附带识别置信度的表格形式呈现,这种方式用于评估识别效果
修正识别错误
在识别过程中有时候会出现错误的识别结果,这时候可以手动修正。 在纯文本模式下可以直接修正,表格模式不支持修正,这里着重要说明的是位置文本模式下的修正
默认情况下,位置文本不能编辑,需要打开编辑开关后才能编辑文本,绿色表示经过编辑的文本。
可以打开疑似错误高亮帮助快速定位错误,详情请见设置说明
导出识别结果
PearOCR支持导出识别结果为PDF用于归档和日后查阅,并且支持隐藏文字的方式,能直接在图片上选择和复制文本,PearOCR支持先预览PDF的导出效果
PearOCR配置
可在右下角点击配置按钮,对PearOCR进行配置