Python 怎么把 html 文件里的 mp4 视频提取出来?

2020-06-19 21:02:43 +08:00
 Zhepro
用 code 打开是这样的:
<video width="950" height="950" controls autoplay loop>
<source type="video/mp4" src="data:video/mp4;base64,---一堆字母--->
Your browser does not support the video tag.
</video>
用 chrome 倒是可以手动下载,但是想批量提取,怎么弄呢
2949 次点击
所在节点    Python
5 条回复
crab
2020-06-19 21:07:46 +08:00
b64decode
xiri
2020-06-19 21:07:47 +08:00
把 base64 后面那一堆字符拿出来,然后用 base64 解码
lqzhgood
2020-06-19 21:10:54 +08:00
视频也压 base64~~ 是个狠人呀
iConnect
2020-06-19 23:50:52 +08:00
应该是找 .ts 文件地址,下载拼接起来
kof21411
2020-06-20 08:15:11 +08:00
lists = etree.HTML(html)
infos = lists.xpath("//video/source/@src")

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/683169

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX