Python 中处理 pdf 问题

2018-09-02 17:47:37 +08:00
 bestehen

现在情况是这样,我在处理 pdf 文件的时候遇到了一个水印 对应读取的一个元素是 FormXob.86cdf15f1994e2f2b7032e461

我现在想办法处理

把得到的这个元素给排除掉放进新的 pdf 里面 如何解决呢?

我用的是 Py2PDF

读取的一页元素如下,里面包含了 Formxob {'/Parent': IndirectObject(1, 0), '/Contents': IndirectObject(22, 0), '/Tabs': '/S', '/Resources': {'/XObject': {'/Image5': IndirectObject(23, 0), '/FormXob.86cdf15f1994e2f2b7032e461afd4234': IndirectObject(25, 0)}, '/ExtGState': {'/Xi0': IndirectObject(26, 0), '/gRLs0': {'/ca': 0.13}}, '/Font': {'/F1renamed': {'/Encoding': '/WinAnsiEncoding', '/Type': '/Font', '/Name': '/F1', '/BaseFont': '/Helvetica', '/Subtype': '/Type1'}, '/F1': IndirectObject(27, 0), '/Xi2': IndirectObject(35, 0), '/Xi1': IndirectObject(38, 0)}, '/ProcSet': ['/Text', '/ImageC', '/ImageB', '/PDF', '/ImageI']}, '/Group': {'/Type': '/Group', '/S': '/Transparency', '/CS': '/DeviceRGB'}, '/MediaBox': [0, 0, 720, 405], '/Type': '/Page', '/StructParents': 0}

请问现在如何解决呢?

1880 次点击
所在节点    Python
1 条回复
jiangbingo
2018-09-04 17:52:35 +08:00
getpage 以及 mergePage,水印也是一页叠加的 page,可以看看是否有 deleltepage 的操作。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/485400

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX