[请教] 大佬们，怎么通过 js 把网页保存成 html 呢？

google 和 V2EX 上都搜了一下，但是没有看到比较直接的方案。
都说直接浏览器保存或者使用 singleFile 或者 save page 来保存。

那么有 js 库或者什么方案吗？

NoOneNoBody

114 天前

因为页面内 js 不能操作文件，不然可以存木马了，所以需要扩展或可操作本地文件的程序

xiguaprince

114 天前

@NoOneNoBody 不操作文件，只是把 dom 转成单个 mht 格式的 string ，这个有什么现成的库吗

xiguaprince

114 天前

实在不行我只能扒现成插件的代码了呜呜呜

xiguaprince

114 天前

怎么有人还感谢我

NoOneNoBody

114 天前

没有这样的库，还是那个原因：页面 js 不能操作本地文件
js 读不到浏览器缓存，所以，js 要转图片为 base64 ，需要重新请求一遍，通过 canvas 转 base64
而且还有前置工作是 parse 整个页面，还有非图片的二进制文件如字体，我还想不到怎么做，还有跨域问题，归结一句就是个单页面爬虫了，不如发给其他工具完成
但扩展是有权限读取缓存的，所以就容易很多了

这复杂程度，个人觉得页面 js 不能完成，起码要扩展或者发送给外部完成

Xu3Xan89YsA7oP64

114 天前

这又没啥难度，随便手撸下就能粗略地实现，想更完善就去 npm 搜呗，多到你都挑不过来

imdong

114 天前

也许有一个方案，仅猜测。

pwa 的方式，在 worker 中拦截流量，最后将记录下的数据处理后替换或者重新生成。

但只适合自己的站点。

理论哈，不确定是否可以。

kkocdko

114 天前

这里有一个简陋版的实现，你可以抄一下，根据实际情况改改。

！请注意，不可能适配所有页面，不可能适配所有页面！总是会有局限性的。

https://github.com/kkocdko/user-scripts/tree/master/scripts/save-page

subframe75361

114 天前

document.documentElement.innerHTML ?

fyq

114 天前

可以考虑装一个油猴插件，然后写一个油猴脚本，在网页上插入一个按钮，点一下把你要的这些 html 文本复制到剪贴板里去处理。
不会没关系，具体代码可以让 ChatGPT 帮你写。

cpstar

114 天前

https://www.v2ex.com/t/1059349 ？

zeusho871

114 天前

blob

noqwerty

114 天前

是想要类似 https://github.com/microsoft/playwright?tab=readme-ov-file 的渲染方案吗

ZztGqk

114 天前

而是获取带样式和图片 base64 的 html 文本？所以是在找 parser ？ https://developer.mozilla.org/en-US/docs/Web/API/DOMParser

xiguaprince

114 天前

@ZztGqk 应该是这样，不过仅凭它能把 dom 转成带图片和所有样式的 html/mhtml 吗

xiguaprince

114 天前

@kkocdko 感谢！是这种！一会我运行下看看效果

xiguaprince

114 天前

还有哪位大佬知道呀

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1067489

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.