如果我们的办公文档处理工作中,经常是否有遇到需要对扫描件、图片、PDF等格式文档进行提取表格、OCR文字识别,或者是文件进行排版纠正、跨页合并、绘制表格等工作肯定是需要借助第三方软件的。这里有看到这款国内的PDFlux软件有提供富格式文档解析利器。
PDFlux 软件介绍
PDFlux(pdflux.com),一款国内开发的富文本处理工具,有包括支持PDF文档、扫描件、图片等内容的识别提取,致力于将PDF内容提取变的更简单,提高工作效率。目前,PDFlux 有支持Windows和MacOS系统版本,当然这款软件是付费的,免费有固定的免费点数,有特殊的功能 要求的是需要解锁付费功能的。
通过对于图片、PDF、扫描件等文件的识别处理,可以提高效率的复制到文档中进行重新排版处理。
这里,我们看看 官方介绍的 PDFlux 软件的功能:
- 智能识别复杂排版和无线框表格
- 智能识别旋转角度、自动转正
- 智能排除红黑印章干扰
- 智能生成章节目录
- 智能合并跨页表格
- 自动去除单元格里的换行和空格
- 复制整页内容
- 绘制表格外框生成表格
- 识别图片、OCR识别文字
PDFlux 软件使用
这里我们用的较多的功能还是对于扫描件、图片或者PDF文档无法直接复制上面文字需要进行快速的OCR识别重新编辑摘取。
这里,我拿一个扫描件的PDF文档然后根据需要圈选需要的文字,然后识别,准确度还是比较高的。
对于表格的识别是在文档处理很关键的,有时候如果不能提取出来表格,自己重新做表格特别的麻烦,这里我们直接圈选或者有导入图片,然后识别表格,后直接可以复制到WORD中。
这款PDFlux软件是有免费点数的,如果超过点数是需要额外支付购买。我们可以看到大部分的功能是免费的,个别功能因为耗费计算资源,在软件内设置了部分收费点。