V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  blueboyggh  ›  全部回复第 6 页 / 共 72 页
回复总数  1422
1 ... 2  3  4  5  6  7  8  9  10  11 ... 72  
2023-09-07 15:19:42 +08:00
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@szdosar
@NoOneNoBody

我从我的样本里取了 100 条数据,用三种方法都进行了测试,测试结果:

滑动窗口方法:13 秒完成
itertools 方法:28 秒完成
正则表达式方法:63 秒完成

其中滑动窗口的方法,取出来的样本是最全的,但是结果 list 里一些子元素有相互包含的情况,比如“中了 500 万彩票”和“了 500 万彩票”
itertools 方法的结果更加精简,但是依旧有子元素有相互包含的情况
正则表达式方法则是完全没有子元素有相互包含的情况,但是速度也最慢

以上结果可能因为本人代码小白的问题受影响,不代表三种方法的真实水平,或者有其他隐含的坑我没能力发现
2023-09-07 14:24:16 +08:00
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@NoOneNoBody 谢谢,改成 list 就好了,next 是从网上抄的。
2023-09-07 13:55:45 +08:00
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@szdosar
@NoOneNoBody

对,现在输出能出第一个相同字符串“是个好日子,”了,但是“中了 500 万彩票”没有,是因为我对 yield 返回的 x 的处理方式不对吗?
2023-09-07 09:49:40 +08:00
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
https://pastebin.com/raw/irdJS0iK


@NoOneNoBody 麻烦给看看我处理的缩进和完善的 demo 是否有问题?测试结果只能输出一个“ 万彩票”
2023-09-06 15:12:24 +08:00
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@szdosar 感谢,目前正在测试之前的代码,跑了 3 个小时,跑了 1300 条数据了
2023-09-06 13:55:28 +08:00
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@szdosar 主要是我需要对比的数据是上千条的 excel ,一个一个复制到文本文档,效率太低了吧
2023-09-06 12:27:10 +08:00
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@szdosar 我发现了,因为我是从 excel 表格里提取的内容,如果内容里有换行符,就会影响判断,即使换行符并不在需要提取的相同文本内,也不行,这是因为换行符会影响字符串提取吗?
2023-09-06 11:53:21 +08:00
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@szdosar 实际我的长度需求是 8 ,我改成 8 了,也不行,我题目中这个例子是可以的,但是我实际需要用的字符串不行
2023-09-06 11:23:27 +08:00
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@Pipecraft
@szdosar

我发现用二位的代码,用我题目中的例子就可以正常运行,但是用我实际需要匹配的字符串,就找不到匹配项,可是明明里面就有匹配项。哪位能加个联系方式帮帮忙...有偿也可以
2023-09-06 09:43:06 +08:00
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@szdosar 好的,我先用了楼上老哥的代码,先测试,回头再试试您的
2023-09-06 09:42:43 +08:00
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@Pipecraft 十分感谢您!祝您中 500 万!
2023-09-06 08:04:38 +08:00
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@flyqie 我测试了一下,好像不用改#号数量也能用
2023-09-06 07:19:06 +08:00
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@flyqie 不太理解您的固定和动态调整的意思?
2023-09-06 06:48:18 +08:00
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@Pipecraft 十分感谢,再麻烦问一下,如果长度要求不是 4 ,而是 8 ,是不是只把正则代码里的 4 改成 8 就行了?
2023-09-05 22:19:45 +08:00
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@ladypxy 没必要什么都往这上面想吧
2023-09-05 22:19:28 +08:00
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@cdwyd 确实不是举例的长度,字符串字数可能一百多字,甚至更多
2023-09-05 22:04:16 +08:00
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@cy18 虽然看不懂,但还是谢谢
2023-06-28 16:00:48 +08:00
回复了 mikaelson 创建的主题 程序员 大佬们,内网穿透哪种方案适合我?
最近发现用 tailscale 的时候,真实局域网内两个终端之间通过本地 ip 互相 smb 传送文件,明明没通过 tailscale 的 ip ,但是 tailscale 的服务会高占用 cpu ,搞不懂为什么,卸载了只用 zerotier 了
2023-06-21 13:02:51 +08:00
回复了 BaseException 创建的主题 Linux 买的新笔记本安装 Linux 但无线网卡无法驱动,求帮助
暂时弄个免驱的 usb 网卡用着呗
2023-06-17 19:51:50 +08:00
回复了 KoreaFish 创建的主题 路由器 求推新路由 3 固件
老毛子 padavan 呗
1 ... 2  3  4  5  6  7  8  9  10  11 ... 72  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5584 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 26ms · UTC 07:29 · PVG 15:29 · LAX 23:29 · JFK 02:29
Developed with CodeLauncher
♥ Do have faith in what you're doing.