有没有那种可以识别到缩进宽度的 OCR 库?

2023-09-11 12:24:09 +08:00
 amiwrong123
first chapter................1
    introduction.............2
    so.......................4
        dfuh.................5
second chapter...............10

我现在有个需求是,识别一个 pdf 的目录,我现在通过 py 脚本已经知道了每个标题是啥了,但是不知道他们这些标题分别的级别。它大概长这个样子。里面都是英文单词或数字。

1314 次点击
所在节点    程序员
5 条回复
mhycy
2023-09-11 12:38:00 +08:00
建议找找 AI 相关的 OCR 方案
iOCZ
2023-09-11 12:39:42 +08:00
缩进其实不是文本的范畴,是文本框位置大小了,所以你要找找有没有库能提供这些信息
Sirius8
2023-09-11 13:44:32 +08:00
百度 OCR+chatgpt 语义识别,目前在用,还可以
GGMM
2023-09-11 13:49:51 +08:00
我之前用过 Paddle-OCR ,它其中一套流程是这样的:文字框检测,得到词条 -> 词条文字方向判断(横 or 竖)-> 对词条进行文字识别。可能可以对文字框检测这一步加一些条件进行缩进划分。
amiwrong123
2023-09-11 14:19:38 +08:00
@iOCZ #2
好像 py 库 pdfminer 本身有这个功能,回头我去试试。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/972695

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX