Python 如何实现字符串比较并输出不同点

2017-12-24 11:42:57 +08:00
 linkbg

举例子: a = '123sdasiioi' b = '123sdasiioi12'

最终输出: 12

已经尝试 diff 和通过列表的方式。但是最终没能完成想要的结果,求指导。谢谢

5920 次点击
所在节点    Python
11 条回复
lihongjie0209
2017-12-24 11:47:12 +08:00
```

>>> b.replace(a, "")
'12'
```
imn1
2017-12-24 11:50:58 +08:00
其实,你还需要定义“不同点”
abc vs bac 期望结果是什么?
Zzde
2017-12-24 11:51:20 +08:00
取差集?
SakuraSa
2017-12-24 12:31:00 +08:00
这个问题的重点还是怎么定义“不同点”
不过对于序列的不同,有一个比较通用的定义方式:编辑距离
编辑距离,就是通过
1. 插入一个元素
2. 删除一个元素
3. 修改一个元素
将一个序列变成另一个序列的最短步数
我觉得这个最短步数的操作序列可以作为“不同点”的定义

在 python2.7+中有个 difflib 实现了序列编辑距离的计算

import difflib
a = '123sdasiioi'
b = '123sdasiioi12'
print(difflib.SequenceMatcher(None, a, b).get_opcodes())

>>> [('equal', 0, 11, 0, 11), ('insert', 11, 11, 11, 13)]

把 equal 去掉,大概就是你说的不同了
linanwy
2017-12-24 13:50:51 +08:00
典型的 X-Y Problem。最好把你的使用场景和目的说出来。
linkbg
2017-12-24 14:35:21 +08:00
@imn1 @SakuraSa 位置是不固定的。
场景:
@linanwy 爬虫数据清洗。以一个时间点的为初始化字符串,之后根据这个字符串啦提取更新的子字符串。
SakuraSa
2017-12-24 14:48:25 +08:00
@linkbg
编辑距离并不不会受到位置的影响,例如:

import difflib
a = 'abc'
b = 'axxc123'
print(difflib.SequenceMatcher(None, a, b).get_opcodes())

>>> [('equal', 0, 1, 0, 1), ('replace', 1, 2, 1, 3), ('equal', 2, 3, 3, 4), ('insert', 3, 3, 4, 7)]
SakuraSa
2017-12-24 14:59:39 +08:00
@linkbg

更直观的形式(py3):

import difflib
a = '00abc'
b = 'axxc123'
opcodes = difflib.SequenceMatcher(None, a, b).get_opcodes()
print('change "%s" to "%s":' % (a, b))
print(*(
'%6s "%s"->"%s"' % (op, a[af:at], b[bf:bt])
for op, af, at, bf, bt in opcodes
if op != 'equal'), sep='\n')

>>>output:
change "00abc" to "axxc123":
delete "00"->""
replace "b"->"xx"
insert ""->"123"
param
2017-12-25 06:11:15 +08:00
求最长子序列?动态规划经典算法。。。
saulshao
2017-12-25 10:40:37 +08:00
这个问题本身需要进一步澄清:
假设: a = 'xy123sdasiioi' b = '123sdasiioi12'
你希望输出什么?
dirls
2017-12-26 10:12:51 +08:00
我是仔细研读了楼主的题目,还是没看懂题主要表达什么意思?如果举例有几类不同的情况,请全部举出来!
如果仅举例子:a = '123sdasiioi' b = '123sdasiioi12'
1 楼的就能输出结果啊!!

提问很重要!

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/417196

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX