@Livid @whtsky at/email/url的re

2012-07-03 03:26:13 +08:00
 luztak
@Livid @whtsky
http://gist.github.com/3034918
其中,at_user_filter只适合英文数字用户名,可以带"-"和"_".并且可以过滤邮箱地址.
email_filter中默认添加了几种常用的后缀,一般也只用得到这些后缀.
url_filter可以解析http/https/ftp协议/无协议字符的地址,支持泛解析域名,后缀懒得限制,如果需要可以自己改.整个地址支持只有域名,域名加斜杠,域名加目录文件名,并且用了unicode,支持中文.
目前只有at_user_filter是针对从整段文字抽取做过调整的,email和url特征比at_user复杂,不需要限定条件.
所有代码在 codepad.org 的Python2.5环境下测试通过.测试结果地址见gist中的test_result_urls.
2749 次点击
所在节点    Python
2 条回复
luztak
2012-07-03 03:26:32 +08:00
luztak
2012-07-03 03:34:22 +08:00
@Livid email_filter开头那个\w+我在gist改成\w{1,63}了,这边不动……而且个人信息页的GitHub repos列表也是固定的,难道不能走他们的流量?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/41235

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX