OCR,即光学文字识别。在日常的工作学习中,相信打开这篇文章的你和笔者一样都有着把纸质文件转为电子文档的需求。目前,国内外大厂大都把 OCR 作为其人工智能研究的方向之一。那么,目前有没有一款好用又靠谱的 OCR 项目呢?市面上的 OCR 项目又都有何优缺点?
出于个人需求,笔者在多平台收集了几款OCR 软件/网页,逐一收录如下。
百度/讯飞/搜狗 输入法
相信这几款输入法也算是国民级的应用了吧。目前大厂的应用功能都很花里胡哨,比如这几款输入法就都自带了 OCR 功能。
值得一提的是,最近搜狗输入法推出的最新PC版本,宣称去除了所有流氓广告[1],各位可以试试看。
优点 | 免费,无限制,大厂技术加持,准确率较高 |
缺点 | 臃肿,没有文档转换等高级功能 |
白描
白描是一款个人开发的 OCR 软件[2],笔者认为是移动端里几乎最好的文字识别方案,所以前段时间在数码荔枝入了正版。
白描提供完整的文字识别解决方案,从扫描到转换一应俱全,而且据说使用的是百度的收费 API,识别率还是很高的。经过多年的发展,现在的白描已经以客户端的形式登陆了iOS、Android、macOS 平台,并且提供 网页版 ,极大拓展了白描的使用场景。
白描的基础功能是免费的,但是有两档收费模式可选,目前都是买断制,价格都很便宜[3]。笔者写作前刚刚涨了一波价,短期内收费模式应该不会改变。
优点 | 功能完整,多端支持,大厂技术加持,准确率较高 |
缺点 | 免费用户有限制,没有提供 Windows 版本 |
CS 扫描全能王
扫描全能王,是一款著名的文档处理软件,其开发者在文字处理领域颇有建树。最近他们的 OCR 从会员专属下放给了免费用户,可以使用基本的文字识别功能。并且他们对 PDF 的处理比较完善。有文档处理需求的读者可以试试。
鉴于这款软件在应用商店李鬼较多,笔者在这里放一下他们的 官网 。
优点 | 文档处理功能完整,多端支持,多年技术沉淀,准确率较高 |
缺点 | 免费用户有限制,高级用户收费高昂[4] |
Pear OCR
PearOCR 是一款免费无限制的在线 OCR 工具,最大特色是使用自己的 OCR 识别引擎,全部识别过程在浏览器本地完成,不受限于需要付费的大厂 API 服务。
@Appinn
- 自研识别引擎,不用大厂API,全部识别过程在浏览器本地完成,没有数据上传,保护数据安全避免滥用
- 完全免费,没有次数/大小限制,不需要自行申请API,不需要登录,不需要下载
- 以原图文本位置排版,方便对照
- 支持导出为PDF,方便归档
个人开发者的作品,自研引擎是怎么一回事笔者也不知道,但网页版开箱即用倒也方便,免费无限制,还支持 PDF 导出,这么良心必须推荐一下。
没有客户端,但是作者也许会支持 PWA 。
优点 | 免费无限制,识别率尚可,本地识别,安全性高 |
缺点 | 功能简单,无客户端 |
ABBYY 、Adobe Acrobat
这两个软件都是桌面端的 PDF 处理软件,但是在本地 OCR 识别和结果的呈现上,这两款软件都有着独特的优势。其中 Adobe Acrobat 还有把扫描文档 OCR 后矢量化文字的功能,笔者实测很惊艳。
以上两款软件仅有桌面端才提供完整功能,且价格不菲。出于版权问题,本站不提供下载。
优点 | 识别率高,本地识别,安全性高 |
缺点 | 价格昂贵,使用不方便 |
微软 AI 识图微信小程序、微软 Office 应用
最后来介绍下在美少女人工智能方面一直很上心的微软。他家给普通用户的 OCR 做在了微信小程序上,就笔者个人体验而言,可能还不如臃肿的大厂输入法。
小程序的功能很简单,就是 OCR,然后给你返回文字。识别率在前面一众大厂服务中属于中等水平,其实并不拔尖。
至于 office 软件,笔者订阅了 Microsoft 365 ,文档转换功能中有专门的OCR 入口,联网识别,准确率就那样。一般人应该不怎么会用的,但谁让他便宜呢。
优点 | 成本较低,手机使用方便 |
缺点 | 识别率一般,识别速度较慢 |
iOS Live Text
本来以为写到微软就结束了,没成想苹果竟然在系统里自带了一个 OCR 模块。笔者加入了 Public Beta,实测本地识别速度快,而且结果完全是可用的。与系统深度集成,使用很方便。
由于笔者不是安卓用户,所以没法对比其他厂商的功能了。
优点 | 识别率高,速度快,本地识别,与系统深度集成,使用方便 |
缺点 | 没有独立APP,只能以文本形式导出,使用场景受限 |
百度飞桨-PaddleOCR
这并不能算是一个服务,至少百度飞桨开源库里的其中一个组件。由于没有现成的客户端,使用需要你有一定的动手能力。但是据说识别算法在本地 OCR 中算是十分杰出的。
他们的 Github 仓库在这里: https://github.com/PaddlePaddle/PaddleOCR
优点 | 本地识别,自定义程度高 |
缺点 | 对使用者有一定技术要求 |