怎么删除特殊字符?

2017-02-27 13:43:07 +08:00
 omg21
<span> </span>

上边这个代码中间我以为是空格,用 replace 替换不掉,一检查编码才发现不是空格,是\u003F ,这样的应该怎么删?
2386 次点击
所在节点    Python
11 条回复
rocksolid
2017-02-27 13:46:23 +08:00
你的目的是什么,删除 span 中间的内容?
m939594960
2017-02-27 13:49:07 +08:00
用这则啊\s
Kisesy
2017-02-27 13:50:34 +08:00
replace('\u003F', '') 一样删啊
omg21
2017-02-27 13:54:43 +08:00
@Kisesy 删不掉啊,我试过了
omg21
2017-02-27 13:55:15 +08:00
@rocksolid 对,就是想删掉中间内容
xingo
2017-02-27 13:59:14 +08:00


黑人问号
omg21
2017-02-27 14:16:51 +08:00
@xingo 可能是这个字符不是 003f...
rocksolid
2017-02-27 14:20:58 +08:00
@omg21

正则

import re

s='<span>asasdasd</span>'
patt=re.compile('(?<=\<span\>).*(?=\<\/span\>)')
ans=patt.search(s)
if ans:
print ans.group(0
staticor
2017-02-27 14:46:37 +08:00
换个角度, 不用黑名单改成白名单
Gandum
2017-02-27 15:00:12 +08:00
当然不能 replace ,因为'\u003F' == '?'
你这里这个,在 html 里显示为&nbsp;的玩意,叫 no-break space , unicode 为\u00A0
omg21
2017-02-27 16:41:40 +08:00
@Gandum 嗯嗯,用 replace ('\u00A0','')通过了,我之前是用“文本转换工具”查看的编码。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/343500

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX