[请教] 大佬们，怎么通过 js 把网页保存成 html 呢？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 392 天前的主题，其中的信息可能已经有所发展或是发生改变。

google 和 V2EX 上都搜了一下，但是没有看到比较直接的方案。
都说直接浏览器保存或者使用 singleFile 或者 save page 来保存。

那么有 js 库或者什么方案吗？

第 1 条附言 · 2024-08-24 17:16:03 +08:00

不是想保存成文件，而是获取带样式和图片 base64 的 html 文本

第 2 条附言 · 2024-08-25 10:10:56 +08:00

是通过 js 把 dom 转成那种带内联样式和图片的 mht 或者 html

保存

HTML

17 条回复 • 2024-08-25 12:59:03 +08:00

NoOneNoBody

2024-08-24 16:24:36 +08:00

因为页面内 js 不能操作文件，不然可以存木马了，所以需要扩展或可操作本地文件的程序

xiguaprince

2024-08-24 16:37:33 +08:00

@NoOneNoBody 不操作文件，只是把 dom 转成单个 mht 格式的 string ，这个有什么现成的库吗

xiguaprince

2024-08-24 17:08:44 +08:00

实在不行我只能扒现成插件的代码了呜呜呜

xiguaprince

2024-08-24 18:22:05 +08:00

怎么有人还感谢我

NoOneNoBody

2024-08-24 18:23:30 +08:00

没有这样的库，还是那个原因：页面 js 不能操作本地文件
js 读不到浏览器缓存，所以，js 要转图片为 base64 ，需要重新请求一遍，通过 canvas 转 base64
而且还有前置工作是 parse 整个页面，还有非图片的二进制文件如字体，我还想不到怎么做，还有跨域问题，归结一句就是个单页面爬虫了，不如发给其他工具完成
但扩展是有权限读取缓存的，所以就容易很多了

这复杂程度，个人觉得页面 js 不能完成，起码要扩展或者发送给外部完成