关于 OCR 识别的一些疑问

2021-12-25 23:36:09 +08:00

yestodayHadRain

楼主现在有个需求，是要将 PDF 扫描件也就是图片转换成 word 格式文件。目前能想到的是直接调用第三方的 OCR 接口，但是图片中定部和底部的内容识别后不能保持原来的样式，中间的表格的样式可以保存。
有试过腾讯云和百度智能云的表格识别，接口支持返回 excel 文件的 base64 编码。但是顶部和底部的样式保存不了，查了下这两家都不支持返回 word 格式。这个大佬们有好的思路推荐吗？
主要是考虑到 PDF 扫描件的格式不确定，所以不能提前设置好模板去写 word 文件。

2060 次点击

所在节点

问与答

15 条回复

Jooooooooo

2021-12-25 23:38:42 +08:00

不知道是否有能自动生成表格的公开库

yestodayHadRain

2021-12-25 23:43:12 +08:00

@Jooooooooo
这个考虑到精准度，就没有找开源的。直接拿腾讯云和百度智能云的接口试的，他们好像只有表格识别的接口。

只是识别表格是不行的，顶部和底部的文字也需要提取，并且要保证原有的样式才可以。

dingwen07

2021-12-26 00:47:56 +08:00

我记得应该有一种是他让扫描件保留原图，但是可以用鼠标直接复制上面的文字。微软 Office Lens 就是这样的，但是我不知道是不是有第三方实现。

yestodayHadRain

2021-12-26 00:54:52 +08:00

@dingwen07 问题是扫描件都没有，拿到手的就是图片，需要在图片的基础上做处理

Grouie

2021-12-26 02:04:00 +08:00

abbyy ？

zdndk598

2021-12-26 05:05:57 +08:00

直接 Acrobat OCR 修改打印不行？

holong2000

2021-12-26 06:59:15 +08:00

abbyy finereader pro ，把图片格式的 pdf 识别，可以输出 word ，也可以 excel ，表格保存什么样就不知道了

caryRowen

2021-12-26 07:51:03 +08:00

abbyy 表格识别不错

yestodayHadRain

2021-12-26 10:19:33 +08:00

@holong2000 这个好像是一个应用？有在线调用的接口吗？想在程序里实现

holong2000

2021-12-26 11:27:32 +08:00

软件，windows 版的引擎一般要领先其它版本

512357301

2021-12-26 11:55:19 +08:00

Excel5 年沉迷用户浅答：你这么干效率很低啊，这明显是表格，这是 Excel 擅长的领域啊，即使你转成 Word 又能如何，难道只是用 Word 打印或者留底儿，那明显 pdf 更擅长打印个留底儿啊。。。
将来不需要汇总吗，不需要排名吗，不需要做表吗，需要的话这都是 Excel 擅长的啊。。。
而且用 pdf 汇总和用 word 汇总貌似没啥区别，都是肉眼看吧，然后手动输入吧(假设 Excel 不介入的情况下)
而且这种评价你在一开始就得介入，让他们用 Excel 甚至网页填报，这样将来产出的都是规范化的数据了，别说汇总了，玩出花来都可以

holong2000

2021-12-26 12:16:10 +08:00

上面那个图片我用 abbyy finereader ocr 转成 excel 试了一下，我觉得还行

hertzry

2021-12-26 13:45:39 +08:00

@512357301 #11 不愧沉迷了 5 年，行家。

nnqijiu

2021-12-26 13:53:13 +08:00

wps 可以转

leafre

2022-03-12 20:42:53 +08:00

遇到相似问题，老哥最后如何解决

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/824445

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.