用 Python 写一个爬虫,爬取视频资源并保存,视频按分类存放在硬盘上,目录创建失败致无法保存

2017-12-23 13:11:32 +08:00
 abusizhishen

部分分类名称含有特殊字符、导致创建目录出错。有什么好用的模块或方法能检测并修正目录吗?

2830 次点击
所在节点    问与答
11 条回复
lishunan246
2017-12-23 13:13:11 +08:00
slugify
abusizhishen
2017-12-23 13:14:51 +08:00
创建目录之前检测一遍,有特殊字符就替换或者去掉,再去创建目录
Kilerd
2017-12-23 13:44:36 +08:00
md5(name) 满分答案
Kilerd
2017-12-23 13:45:11 +08:00
然后用一个 sqlite 数据库记住 名字 => md5 目录的对应关系
abusizhishen
2017-12-23 13:59:52 +08:00
@lishunan246 一会看下
abusizhishen
2017-12-23 14:03:01 +08:00
@Kilerd 复杂了,我保存在本地,直接浏览的
lniwn
2017-12-23 14:15:45 +08:00
@abusizhishen 先创建目录,如果失败了再检测并替换非法字符。
manzhiyong
2017-12-23 14:47:04 +08:00
一般我的目录名都是数字,是附件数据库 id 除以某个数(目录下存放文件数)的值。
frank611
2017-12-23 14:58:10 +08:00
???
Arnie97
2017-12-24 02:20:27 +08:00
直接正则替换掉特殊字符不能满足需求?
abusizhishen
2017-12-24 14:16:40 +08:00
@Arnie97 如果有模块能提供这个功能更好

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/417040

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX