PearOCR文字识别:在线图片转文字,免费OCR,在线图片文字提取

官网:https://pearocr.com/

PearOCR是一款免费无限制的在线 OCR 工具,最大特色是使用自己的 OCR 识别引擎,全部识别过程在浏览器本地完成,不受限于需要付费的大厂 API 服务。

特征

完全免费

市面上提供OCR的软件大部分有各种限制(识别次数或者文件大小),需要收费才能解除限制,而PearOCR的识别完全免费,没有次数和文件大小限制。

本地运算

市面上的OCR软件大部分是利用大公司的API进行识别,需要把图片上传到服务器再返回识别结果,这个过程有可能导致个人数据的泄露和滥用。PearOCR基于自研的轻量化识别引擎,整个过程都在本地运算,不会把图片或者识别结果上传,从原理上保护数据安全。

优化排版

PearOCR的识别结果采用和原图文本相同位置的排版,便于进行文字的提取和分析

无需下载

PearOCR所有过程均在网页端完成,无需下载任何软件,点开即用

PDF导出

提供导出PDF的功能,把图片和文本都集在同一个PDF中,方便存档和对照,同时提供了不同的PDF排版选项

加载图像

PearOCR提供了多种加载图像的方法,尽可能地简化使用过程。支持同时选取/拖拽多张图片进行识别。

通过对话框选取本地图像

点击[本地图片]按钮,从弹出的对话框中选择要识别的图片 本地图片

拖动文件进行识别

除了通过打开选择对话框,还可以直接把文件拖到识别框内进行识别 拖拽图片

剪贴板加载

PearOCR可以直接读取剪贴板的图像,配合截图工具(如微信,QQ),截图完直接识别,无需另存为本地文件

除了点击按钮,也可以通过Ctrl+V快捷键加载剪贴板中的图像

%title插图%num

获取识别结果

查看识别结果

PearOCR提供了三种方式查看识别的结果文本。

带位置信息的文本(推荐)

按照原图中出现文本的位置进行排版,这种方式能十分方便地从杂乱的文本中提取所需信息。
为了方便对照,PearOCR提供了图片衬底的功能,能在图片上面对应位置显示文本,更方便地查看识别结果

%title插图%num
纯文本

把识别的文本位置从上到下排列组合成一段文本,这种方式适用于规则的从上到下排版的文本段。

%title插图%num
表格

识别的结果以附带识别置信度的表格形式呈现,这种方式用于评估识别效果

%title插图%num
修正识别错误

在识别过程中有时候会出现错误的识别结果,这时候可以手动修正。 在纯文本模式下可以直接修正,表格模式不支持修正,这里着重要说明的是位置文本模式下的修正

%title插图%num

默认情况下,位置文本不能编辑,需要打开编辑开关后才能编辑文本,绿色表示经过编辑的文本。

可以打开疑似错误高亮帮助快速定位错误,详情请见设置说明

导出识别结果

PearOCR支持导出识别结果为PDF用于归档和日后查阅,并且支持隐藏文字的方式,能直接在图片上选择和复制文本,PearOCR支持先预览PDF的导出效果

%title插图%num

PearOCR配置

可在右下角点击配置按钮,对PearOCR进行配置

%title插图%num

留下评论