大佬!我又来了! 怎样获取到网页中的 pdf 文件

2020-06-05 15:11:53 +08:00
 xueyoucai

http://bulletin.cebpubservice.com/biddingBulletin/2020-06-05/3034096.html

上述网站中的 pdf 文件,我可以获取到一个 swf 文件,这个文件只能用 360 浏览器打开。

有没有办法批量获取到 pdf 文件

感谢各位大佬!!

4329 次点击
所在节点    Python
25 条回复
Latin
2020-06-05 16:50:20 +08:00
sleepm
2020-06-05 17:21:40 +08:00
扫码有惊喜,关注后有手机查看的页面,里面有链接
muyi
2020-06-05 17:28:19 +08:00
使用 swftools 中的 swfrender 将 swf 转成 png,再用 imagemagick 将所有 png 合成 pdf,这两步都能用命令行完成,写个软件可以做到批量化
frankyxu
2020-06-05 17:44:16 +08:00
ffdec 将 swf 转成 image,命令如下
java -jar ffdec.jar -cli -export image images C:\Users\EDZ\Downloads\bf8792877a7d48bcb48564fce83f99fa.swf
然后自己写个函数将 image 转成 pdf
Arrowing
2020-06-05 17:51:02 +08:00
swf to pdf,我试了可行。
先安装 pdf 24,他会安装一个虚拟打印机。
然后在浏览器上点击打印,选择这个虚拟打印机,选择之后,又个选项是保存 PDF 选项。
成功!
现在就是怎么把这些操作自动化,就可以完成你的任务了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/678982

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX