有没有什么语言可以对 PDF 有这样的操作?

2017-06-17 15:48:14 +08:00
 ethanlu
查找 PDF 里面的内容,比如 date:2017-6-16,找到 date 然后把 2017-6-16 提取出来?
1721 次点击
所在节点    问与答
5 条回复
xycool
2017-06-17 16:44:29 +08:00
用正则都行吧?
ethanlu
2017-06-17 17:05:05 +08:00
If AVDoc.FindText(TextToFind, True, True, False) = False Then
。。。。。

TextToFind 就是要找的内容,正则需要 API 支持吗?
Kirscheis
2017-06-17 17:05:07 +08:00
这和语言没有关系,随便什么语言都可以。有 pdf 解析库的语言方便一些,比如 java、python。
当然,也可以先调用 poppler-utils 之类东西 extract,再用任何语言处理
jugelizi
2017-06-17 17:13:31 +08:00
首先你得把文件内容解析出来
语言都是放风筝的事
ethanlu
2017-06-17 17:51:02 +08:00
我公司能让我用的编程工具只有 Excel VBA,我需要在 VBA 里面调用 adobe acrobat reader 的 API 去查找,TextToFind 变成\d{4}-\d{2}-\d{2}这样的正则就能行?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/369119

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX