熊猫吃短信:全新的基于机器学习的垃圾短信过滤应用(iOS ¥ 1 元特价)

2017-12-04 11:28:18 +08:00
 waylybaye

作为一个生活在移动互联网时代的技术宅,饱受骚扰短信之苦,但没有一个简单的又不用上传自己短信的过滤应用。于是我从自己收到的两万多条短信以及测试期间用户提交的短信样本中训练出了熊猫。

iOS 11 带来了非常强大的 CoreML 机器学习框架,开发者都用来做视觉处理了,我就用它做一个文本归类的应用吧,让熊猫可以在手机里安家。

熊猫吃短信

准确的语义识别

熊猫从庞大的样本中学习到了垃圾短信的文本模式,可以非常准确的从复杂的语义环境中对短信进行分类。比如下图中非常相似的 [京东支付] 的两条短信。

你可以拷贝短信后,在应用里面点击 准确性测试 来测试准确度。

使用非常简单

您只需要安装后打开 设置 → 信息 → 未知与过滤信息 然后选中 熊猫吃短信 即可。熊猫就会默默的帮你吃掉垃圾短信。

关注隐私

熊猫不需要服务器端,不需要联网。应用自带完整的训练模型,使用 CoreML 就可以在手机上对短信进行分类。iOS 11 的沙盒限制也不允许短信过滤器访问网络以及向主 App 共享数据。虽然通过配置项可以让 iOS 11 向自己的服务器上发送短信在云端判断,但是熊猫并没有使用这一功能。

自动进化

熊猫正在飞速成长中,分类准确性依赖于熊猫有没有见过类似的信息。但是世界那么大,总有没吃过的东西,熊猫也有见识浅的时候。基于自愿原则,您可以在应用里面提交新的短信样本喂养熊猫,熊猫会从新的样本中学习到新的垃圾或者正常短信模式。

注意:提交短信样本会将短信匿名上传到服务器上,并非本地训练,熊猫将在云端完成学习,然后分发到所有人的手机上。

关于偏食

由于熊猫是我教的(监督学习),其一定程度上继承了我的喜好,对于有些比较模糊的短信,比如优惠、促销信息,我是一律标记为骚扰短信的。但是有些人可能会喜欢收到此类通知,大家自行取舍。

系统限制

由于 iOS 11 的系统设计原因,被过滤的短信也会显示角标,以及在 Apple Watch 上通知。另外 iOS 11 过滤短信是基于对话的过滤,如果同一个号码既发骚扰短信又发正常短信,那么整个对话都会被过滤。这种现象常见于五位数的号码,但 10 开头的短信发送端口非常少见。

最后

16465 次点击
所在节点    分享创造
191 条回复
Mcatt
2017-12-05 09:26:35 +08:00
已经购买支持
waylybaye
2017-12-05 09:32:23 +08:00
@trotyoung 熊猫痴汉(
lingo
2017-12-05 09:54:33 +08:00
好像买了的都有爱心诶,我也买了我也要
latteczy
2017-12-05 10:06:21 +08:00
之前提了 tf 为啥木有通过咩?
waylybaye
2017-12-05 10:09:05 +08:00
@lingo 😉 补一个

@latteczy 你的短信不是瞎填的吧,我把瞎填的都给删了
ChenPeiPei
2017-12-05 10:09:08 +08:00
资瓷~已买全家桶
wethen
2017-12-05 10:10:04 +08:00
能不能把带“验证码”的文本信息权限调高一点,中国联航的验证码信息都被屏蔽掉了
waylybaye
2017-12-05 10:12:11 +08:00
@wethen 能发个样本吗,有些验证码不是用验证码这个词…
Patrick95
2017-12-05 10:13:59 +08:00
已购买支持!
cloverstd
2017-12-05 10:15:50 +08:00
能不能提供『训练』的 URL Schemes
wethen
2017-12-05 10:17:48 +08:00
@waylybaye
[中国联航] xxxxxxxxx,终于等到你,从今天开始您就是我们的会员啦!登录官网 m.flycua.com 完善您的个人信息即可尊享更多优惠,小联将竭诚为您服务哦~您的动态验证码为:xxxxxx,感谢您对中国联航的支持!好朋友,一起飞!
waylybaye
2017-12-05 10:18:32 +08:00
@cloverstd 可以可以,我还打算加个 3D Touch 的快捷方式。
waylybaye
2017-12-05 10:20:36 +08:00
@wethen 感谢,我下个版本重新训练下熊猫,确保验证码类的准确率接近 100%
Patrick95
2017-12-05 10:24:28 +08:00
我测试了测,信用卡的营销短信基本都被识别为正常短信了,看来还得继续喂养。
Patrick95
2017-12-05 10:27:21 +08:00
喔我知道了,如果是招行信用卡的营销短信,熊猫是不屏蔽的,如果屏蔽了,消费提醒短信也会受到牵连,因为是基于会话屏蔽的。
Thiece
2017-12-05 10:32:03 +08:00
emmmm,已经存在的短信不会进行规律整理吗?
xcatliu
2017-12-05 10:35:18 +08:00
购买支持~
waylybaye
2017-12-05 10:35:26 +08:00
@Patrick95 虽然你脑补的很好,但事实应该是熊猫判断错了 😂

如果你是在 App 里面的 [准确性测试] 里边测试出来是熊猫判断为正常短信的那就是判断错了。不过我用招行这么多年,它的营销短信我都标注为垃圾短息了,一般也不会判断错啊……
jinzhe
2017-12-05 10:35:48 +08:00
既然能得到内容会不会自动收集私人短信?细思极恐
waylybaye
2017-12-05 10:35:50 +08:00
@Thiece 不会啊,只有新短信会。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/411764

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX