首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
宝塔
V2EX  ›  问与答

有没有什么语言可以对 PDF 有这样的操作?

  •  
  •   ethanlu · 2017-06-17 15:48:14 +08:00 · 1091 次点击
    这是一个创建于 885 天前的主题,其中的信息可能已经有所发展或是发生改变。
    查找 PDF 里面的内容,比如 date:2017-6-16,找到 date 然后把 2017-6-16 提取出来?
    5 回复  |  直到 2017-06-17 17:51:02 +08:00
        1
    xycool   2017-06-17 16:44:29 +08:00 via iPhone
    用正则都行吧?
        2
    ethanlu   2017-06-17 17:05:05 +08:00
    If AVDoc.FindText(TextToFind, True, True, False) = False Then
    。。。。。

    TextToFind 就是要找的内容,正则需要 API 支持吗?
        3
    Kirscheis   2017-06-17 17:05:07 +08:00
    这和语言没有关系,随便什么语言都可以。有 pdf 解析库的语言方便一些,比如 java、python。
    当然,也可以先调用 poppler-utils 之类东西 extract,再用任何语言处理
        4
    jugelizi   2017-06-17 17:13:31 +08:00
    首先你得把文件内容解析出来
    语言都是放风筝的事
        5
    ethanlu   2017-06-17 17:51:02 +08:00
    我公司能让我用的编程工具只有 Excel VBA,我需要在 VBA 里面调用 adobe acrobat reader 的 API 去查找,TextToFind 变成\d{4}-\d{2}-\d{2}这样的正则就能行?
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   1151 人在线   最高记录 5043   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.3 · 22ms · UTC 23:19 · PVG 07:19 · LAX 15:19 · JFK 18:19
    ♥ Do have faith in what you're doing.