有没有一种比较好的方案在尽量保证网页样式不变的情况下进行剪藏的方案呢?

2022-11-15 19:22:40 +08:00
 Elaina

现在越来越多的内容被审核给和谐掉,或者某个网站域名更换无法找到了,有没有一种比较好的方案在尽量保证网页样式不变的情况下进行剪藏的方案呢?

或者说开发一个剪藏系统应该以一个什么样的思路呢?

2657 次点击
所在节点    程序员
23 条回复
cmdOptionKana
2022-11-15 19:35:07 +08:00
浏览器插件 SingleFile
hamsterbase
2022-11-15 20:37:46 +08:00
1. 用 singlefile 保存 html
2. safari 右键另存为 webarchive
3. chrome 右键另存为 mhtml

这三种格式都能完美的保存 css ,图片 ,html 。

hamsterbase 支持导入这三种格式的网页。 导入后支持以下功能

1. 完美渲染,

2. 支持在网页上批注做笔记。

3. 全文搜索

4. 根据条件筛选

5. 筛选后以 rss 输出
afutureus
2022-11-15 20:59:15 +08:00
保存为 pdf 。

之前试过 n 种办法,最后用 safari 的 导出为 pdf 解决了。导出的 pdf 是一个完整无分页的。
Garasu
2022-11-15 21:09:11 +08:00
群晖的 note 有个 chrome 的插件,能把网页收藏到 note 里,可以选择简化内容 完整内容 整个页面屏幕截图 屏幕截图 四种。
除了群晖的 note ,一些笔记软件也有这个功能。
DIO
2022-11-15 21:46:26 +08:00
我折腾过很多方案。SingleFile is best
某象笔记 做笔记的话 也不错,但是收费。
chrome 另存 pdf 保存不够完整。

另外还听说过 server 方案,把浏览的网页全部保存,有点心动,但是种种原因还是没尝试
crysislinux
2022-11-15 22:42:53 +08:00
要说方便的话还是得那些笔记软件出的浏览器插件。
hamsterbase
2022-11-15 23:14:53 +08:00
@DIO

试试看我?

1. 支持在 nas 上部署 https://hamsterbase.com/zh/docs/install/synology.html
2. 支持自动导入文件夹下的全部网页。 你之前 singlefile 保存的网页可以全部导入。https://hamsterbase.com/docs/importing-website.html#automatic-importing
3. 支持绑定 singlefile 插件,一键导入。https://hamsterbase.com/zh/docs/integrations/singlefile.html
edis0n0
2022-11-15 23:17:05 +08:00
Ctrl+P 打印为 PDF ,虽然不能搜索不能复制但能保证不会引用外部内容,内容永远不会变
agagega
2022-11-15 23:23:52 +08:00
最完美的方案应该还是逐站进行优化(大部分内容其实都来自那几十个国内外知名网站,剩下的个人博客是很好直接从 html 抓的)。直接保存请求得到的 html 肯定不行,因为很多网站要用 ajax 做渲染,至少得保存渲染完之后的内容
hamsterbase
2022-11-16 00:46:03 +08:00
@agagega

如果不是批量爬虫,手动保存网页,那么 singilefile 、浏览器自带的快照会更合适一点。ctrl + s 就存下来了。
此时保存的是 ajax, 前端框架渲染后的页面。 只需要把当前的 css 、html 、图片 存下来。 基本上保存前怎么样,保存后就是怎么样。 甚至可以 翻译、去广告之后再保存。


如果要批量保存 url ,可以试试看 singlefile 自带的保存功能。

1. 安装 singilefile
2. 右键 -> singilefile -> Batch save URLS...
TuringHero
2022-11-16 00:52:06 +08:00
Cubox 有快照
rpish
2022-11-16 00:54:59 +08:00
cubox/inoreader
WebKit
2022-11-16 01:06:12 +08:00
笔记插件,直接截图保存
efaun
2022-11-16 01:24:56 +08:00
Webrecorder
CSGO
2022-11-16 09:16:40 +08:00
@cmdOptionKana SingleFile 和 Save Page WE 有什么区别?两个我同事保存同一个大网页,一个 20mb ,一个 15mb 。
xiang0818
2022-11-16 09:34:49 +08:00
有道云笔记插件了解一下
cmdOptionKana
2022-11-16 09:39:00 +08:00
@CSGO 没用过 Save Page WE, 看起来也很不错
Jacobson
2022-11-16 10:56:04 +08:00
save as mht
lxxself
2022-11-17 10:24:33 +08:00
@hamsterbase 有点东西,试了试,功能满足。不过 hamsterbase 前端交互一般般,搜索部分也搜不到。不过确实还不错了,打算试一段时间
hamsterbase
2022-11-17 12:12:43 +08:00
@lxxself

非常欢迎加微信详聊, 一起优化交互。

目前有一个搜索优化的版本,我可以私聊发给你。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/895488

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX