有什么好用的照片去重复软件或者脚本

2018-01-23 18:50:23 +08:00
 Sanko
```python
import os
import hashlib
import time
def main():
start = time.time()
file_del,file_num,md5_all,size_all = 0,0,[],[]
path = input('path:')
if os.path.isdir(path):
for root,dirs,files in os.walk(path):
for name in files:
file = os.path.join(root,name)
file_num += 1
size = os.path.getsize(file)
if size in size_all:
with open(file,'rb') as f:
md5 = hashlib.md5(f.read()).hexdigest()
if md5 in md5_all:
os.remove(file)
file_del += 1
else:
md5_all.append(md5)
else:
size_all.append(size)
else:
print('路径错误!')
end = time.time()
print('共扫描'+str(file_num)+'个文件')
print('共删除'+str(file_del)+'个文件')
print('共耗时'+str(end-start)+'秒')
if __name__ == '__main__':
main()
```
感觉我这样写会误删好多
1707 次点击
所在节点    问与答
6 条回复
Sanko
2018-01-23 18:56:27 +08:00
Humorce
2018-01-23 18:59:13 +08:00
删除部分还是手工操作好
Humorce
2018-01-23 19:00:53 +08:00
忘说了程序我用的是 visipics
ELLIA
2018-01-23 20:25:43 +08:00
JohnChu
2018-01-23 20:32:15 +08:00
楼主是用 md5 检测的?
qgswzmz
2018-01-23 20:59:49 +08:00
有个 vsduplicateimagefinder pro 网上找找有破解 曾经用过的 感觉结果还行

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/425338

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX