chrome 上保存网页为 pdf 有没有什么好方法

2022-02-07 17:07:41 +08:00
 ikn0wzxc

用的几个工具都多少有些问题

  1. 打印成 pdf ,有些图片加载不出来,打印后是空白的
  2. 用 singlefile 保存,格式很好,但只能输出 html 格式,不能输出 pdf 格式
  3. 用 pdf mage 保存,内容完整,但遇到图片不会智能分页,经常把一张图片分到两页上,可读性不好
2946 次点击
所在节点    问与答
14 条回复
myd
2022-02-07 17:11:54 +08:00
chrome headless
amirobotics
2022-02-07 17:24:14 +08:00
guowq
2022-02-07 17:42:50 +08:00
利用印象笔记浏览器插件可以实现一部分
muzuiget
2022-02-07 18:42:18 +08:00
CSS 中有可以控制打印时的样式,第 3 点都是可以通过 CSS 解决的,所以感觉可以写个浏览器扩展来先预处理做些修正,然后再调用打印功能。
felixcode
2022-02-07 18:54:48 +08:00
print friendly & PDF
3dwelcome
2022-02-07 19:04:38 +08:00
我是自己写了个插件,默认 pdf 分页把图片切来切去非常影响布局。
索性设置一个超大无边的 PDF 页面,能完美呈现 html 的效果。
jasonyang9
2022-02-07 19:25:37 +08:00
@felixcode +1 FF 上也在用这个,排版分页和样式可读性都很棒。但它的另存为 PDF 是需要通过服务器转换的,不是本地,打印到 PDF 不经过服务器,但打印后的 PDF 中超链接是不可点击的那种,有点可惜。
ETiV
2022-02-07 19:28:31 +08:00
> 打印成 pdf ,有些图片加载不出来,打印后是空白的

是不是图片有 Lazy load ,试着滚动到页面底下,等图片在页面上都加载好了再打印呢?
goodhellonice
2022-02-07 19:52:44 +08:00
“用 singlefile 保存,格式很好,但只能输出 html 格式,不能输出 pdf 格式”

可不可以再加一步

用浏览器打开上述 html ,然后再存 pdf
3dwelcome
2022-02-07 21:26:19 +08:00
@goodhellonice HTML 是流式布局,而 PDF 一般都是 A4 分页保存。

那种多图的文章,图片很容易卡在中间,被自动挤到下一页。

要完美转换格式很难,除非学我魔改 PDF 格式,把页面设置的很长很夸张。
goodhellonice
2022-02-07 21:35:16 +08:00
Yvette
2022-02-08 08:06:07 +08:00
Yvette
2022-02-08 08:06:43 +08:00
@3dwelcome 卡图片倒是有简单粗暴的解决办法 https://www.w3schools.com/cssref/pr_print_pagebi.asp
ikn0wzxc
2022-02-08 09:26:25 +08:00
@3dwelcome 好兄弟可以分享一下你的工具吗

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/832271

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX