有没有熟悉 PDF 内容解析的,想通过 Python 来获取 PDF 内容并格式化入库

2023-01-30 16:41:56 +08:00
 brant2ai
837 次点击
所在节点    问与答
3 条回复
binux
2023-01-30 16:48:49 +08:00
取决于是什么样的 PDF
brant2ai
2023-01-30 16:59:29 +08:00
@binux pdf 来源于 word 转 pdf ,想通过识别直接获取里面的数据。不知道你之前有没有做个类似的
binux
2023-01-30 17:42:12 +08:00
@brant2ai 那就转成 txt 先,再考虑能不能提取

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/911693

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX