求助线程进程问题， IPy 处理 IP 网段

def ipcompare(): ip_list=[] ip_net=[] result=open(r'D:\Python\IP 地址处理\results.txt',"w+") with open(r'D:\Python\IP 地址处理\iplists.txt','r') as lists: for line in lists: ip_list.append(line.rstrip("\n")) with open(r'D:\Python\IP 地址处理\ipnets.txt','r') as nets: for line in nets: ip_net.append(line.rstrip("\n")) for i in ip_list: for n in ip_net: if IP(i) in IP(n): print(f'{n} nets include ipaddress {i}',file=result)

这么写的执行好慢，要 25 分钟才出结果 10 万个 IP 地址，400 个网段，相当于要做 100000*400 次套用 IP('192.168.1.12') in IP('192.168.1.0/24') 来做判断抄了网上几段 threading 和 multiprocessing 来尝试加快执行速度，但是都没有效果求助大佬，要怎么写才能让执行时间缩短？

网段

Nets

Python

ip_net

8 replies • 2021-09-14 18:11:59 +08:00

RRRoger

Sep 14, 2021

先想想能不能优化代码了你这个循环太多了

另外你这个是 IO 密集型，开多线程，基于 GIL 不能用多核，把你的 10w IP 切片处理吧

RRRoger

Sep 14, 2021

高并发 IO 密集考虑一下 asyncio

shiyuu

Sep 14, 2021

IPy 不能直接做列表对比，不然也不用这么循环一个一个放进去了

Kinnice

Sep 14, 2021

代码格式化一下

ch2

Sep 14, 2021

学一点数据结构跟计网的知识吧，判断 ip 在网段内很简单的
你把网段做成一个前缀树，这样就不用重复调用 400 次了
调库改成手动判断
另外这个不是 io 密集，就是你写的代码复杂度太高了而已

todd7zhang

Sep 14, 2021

如果你看下这个的实现 IP('192.168.1.12') in IP('192.168.1.0/24')
就会发现实际上执行和 '192.168.1.12' in ['192.168.1.0', '192.168.1.1', ..., '192.168.1.254', '192.168.1.255'] 没区别
那这个实际执行次数就是 10w * 400 * 255

所以你可以先处理 IP 段每一行变成一个 set(str(i) for i in IP('192.168.1.0/24'))
然后再 '192.168.1.12' in set

实测 1000 * 400 : IP('192.168.1.12') in IP('192.168.1.0/24') 3.92s
1000* 400: '192.168.1.12' in set 18.1ms

mansurx

Sep 14, 2021

有个办法是把 IP 转换成十进制、然后网段取第一个 ip 和最后一个 ip 转成一个数值范围，这样再判断效率会很高。ipaddress 模块也可以看看

MoYi123

Sep 14, 2021

用 pypy，不包含写文件，0.75 秒。
当然你用字典树优化一下肯定能更快。