100 元求一个能保存飞书页面为图文版本的方案

2023-09-10 11:10:06 +08:00
 bjzhush

需求:寻找一个能将飞书文章页面保存为离线的图文版 HTML 的方案

详情:这个问题已经困扰我很久了,因为工作原因,很多资料都在飞书上,但是不是我写的,有些写的好的想备份一份放 obsidian ,但是飞书好像做了反爬或者其他的一些工作,无法保存完整页面,我不是做前端的,没有深入分析过

已测试 SingleFile 及 savePageWe 扩展,只能保存到首屏的内容,GoFullPage 扩展可以截图全屏,但我不想要图片和 PDF 版本的,想要 HTML 版本的

截止时间:2023 年 10 月 1 日前有效,采纳此贴中回复的第一个有效方案,需免费方案

测试链接: https://uwdpzjnryu8.feishu.cn/docx/JGUpdkP0XoOwR0xvp9Xc2ME5ndh

2431 次点击
所在节点    程序员
29 条回复
bjzhush
2023-09-11 00:11:53 +08:00
@a90120411 抱歉,我不是前端,虽然用了很多年 chrome debugger ,但是仅限于基本都网络和 js 片段,让我自己解析拼接文档实在是高看我了。。。


@TheSpecialOne 我去搜了这俩 chrome 扩展,发现我一直用的是 evernote web cliper ,但是我一直是用印象笔记的,但是我试了 clip 整个页面也只捕获到了首屏,且左侧栏直接大片错乱。
然后我试了用 evernote+Evernote web clip ,也是差不多的效果。


@Vimal 有一些稍微负责的格式 MD 会转换错误的,比如表格,所以 HTML 还是得 HTML 来接
a90120411
2023-09-11 00:42:42 +08:00
@bjzhush #21 试试方法 2 吧,简单点一些,但想完美输出,还是要 Coding 的。
飞书这种页面除非是找到有针对性的工具,不然其他网友介绍的通用工具大概率都不可用。
Maxvell
2023-09-11 02:21:19 +08:00
可以直接用飞书文档的打印功能
保存的 pdf 内容是可搜索的,链接可点击,文件略大(19 页图文 7mb)但可接受
算是一个折中的方案
Maxvell
2023-09-11 02:23:33 +08:00
bjzhush
2023-09-11 10:36:07 +08:00
@Maxvell 有些文档连打印权限也没有啊。。
Maxvell
2023-09-11 14:15:59 +08:00
@bjzhush 这种估计非常困难
Mickeyy
2023-09-19 21:17:04 +08:00
同求方案,虽然我不是飞书的网页但是也是类似的需求。
chenjunqiang
252 天前
@Vimal 你好,老哥,方便问下,你这个全文复制到 obsidian 的这个方法,我上个月还可以用,但是现在也不行了,你那边也是吗?

就是可以复制的出来,但是图片带不出来了。图片复制到 obsidian 的时候,变成链接了。不是图片。

然后我测试复制到 evernote 也不行。
hongyexiaoqing
62 天前
飞书文档页面,数据都在 html 里的 JavaScript 层,只要自己手动渲染就行。
这个扩展可以将文档转成 markdown https://github.com/lujunji4113/cloud-document-converter

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/972421

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX