关于 Python OrderedDict 存在内存泄漏的问题

2018-11-13 10:47:00 +08:00
 Buffer2Disk

V 友们有用过这个类的吗? python 2.7 新加的

使用过程中发现貌似存在内存泄漏问题,用 pympler 监控对象的内存, 发现 OrderedDict 对象 和 list 随着时间不断的缓慢增长(OrderedDict 对象的数量没有增加,内存占用却不断缓慢的增长)

这里有一个关于 OrderedDict 内存泄漏的介绍: https://stackoverflow.com/a/46935255/2379891

不过我没有像文中作者那样去 clear,而是不断的 del orderedDict[key], dump 内存中的对象后,也发现了不少和文中作者所说的那种 self-referencing list

使用 OrderedDict 主要是为了实现一个 LRU 缓存(基于缓存失效时间 timeout),不知道 python 官方有没有高性能的 LRU cache 的实现

2225 次点击
所在节点    Python
5 条回复
cgsv
2018-11-14 10:02:10 +08:00
在 gc 开启的情况下,self-referencing list 并不代表内存泄露,只是代表这部分内存只有在 gc 的时候才释放。另外,如果 gc 需要释放的对象定义了__del__方法,那么在 python2 中它就永远不会被回收
Buffer2Disk
2018-11-14 10:19:59 +08:00
@cgsv 因为对性能问题比较敏感,所以没有开启 gc,想通过去除循环引用来解决。,。。。。
cgsv
2018-11-14 13:02:23 +08:00
@Buffer2Disk 据我所知,Python2 的 OrderedDict 链表中使用的是强引用,所以有循环引用的问题。在 Python3 中 OrderedDict 链表使用的是 weakref,所以没有这个问题。可以考虑看一下 Python3 的实现
Buffer2Disk
2018-11-14 14:13:34 +08:00
@cgsv 循环引用在什么样的情况下会内存泄漏(不开启 GC 的情况下)
我测试了下,
如果我直接 del OrderedDict 的对象,好像是会产生一个空的 self-refering list
如果只是 del 其中某一个键值对,好像没有任何泄漏

那么可以认为删除键值对的情况下,没有内存泄漏,可以这么理解嘛?
cgsv
2018-11-14 14:39:22 +08:00
@Buffer2Disk 对的,单个元素的增删不会有内存泄露

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/507293

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX