想保存网页成 mht 格式,有没有类似的库呀

2016-08-06 12:12:44 +08:00
 276562578
大概就是想把一堆网页保存成 mht 格式,找不到可用的库。
各位大大或者给个 mht 的格式标准也行,我自己写一个库
5527 次点击
所在节点    Python
17 条回复
msg7086
2016-08-06 12:16:40 +08:00
RFC 2557?
Let me google that for you.
dsg001
2016-08-06 12:25:49 +08:00
gg 到一个 [Python MHT Library]( https://www.chilkatsoft.com/python-mht.asp)
v9ox
2016-08-06 12:33:11 +08:00
搭车问

爬取到需要登录才能看的网页之后怎么直接把网页直接保存成 pdf ?
songjiaxin2008
2016-08-06 12:35:03 +08:00
owlsec
2016-08-06 12:50:28 +08:00
msg7086
2016-08-06 13:31:00 +08:00
@songjiaxin2008 被人克隆了,正好趁机会换个头。
crab
2016-08-06 13:34:57 +08:00
@songjiaxin2008 Chrome 已经默认支持了。 chrome://flags 设置下支持直接开启保存 MHT 的
276562578
2016-08-06 14:33:08 +08:00
@msg7086 本人业余编程与计算机,这些标准什么的一点都不懂,所以 Google 起来也很吃力
276562578
2016-08-06 14:33:23 +08:00
@dsg001 这个貌似是收费的
276562578
2016-08-06 14:35:36 +08:00
@songjiaxin2008

@crab

并不是保存的问题,是想用在程序里,批量的进行保存
songjiaxin2008
2016-08-06 14:42:59 +08:00
crab
2016-08-06 14:46:42 +08:00
276562578
2016-08-06 20:39:55 +08:00
@crab 这个非常棒,但是非常尴尬的是系统是 linux 的。。。。。。。。。
276562578
2016-08-06 20:40:51 +08:00
@songjiaxin2008 谢谢,但这个是收费的库,而且有 python 的,但是,,收费。。。。。。
276562578
2016-08-06 21:03:56 +08:00
自顶下求不违法
autocar23
2016-08-07 20:06:34 +08:00
276562578
2016-08-07 22:02:00 +08:00
@autocar23 非常感谢,怪我忘记说了,有 python 的库吗

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/297536

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX