熊猫吃短信:全新的基于机器学习的垃圾短信过滤应用(iOS ¥ 1 元特价)

2017-12-04 11:28:18 +08:00
waylybaye  waylybaye

作为一个生活在移动互联网时代的技术宅,饱受骚扰短信之苦,但没有一个简单的又不用上传自己短信的过滤应用。于是我从自己收到的两万多条短信以及测试期间用户提交的短信样本中训练出了熊猫。

iOS 11 带来了非常强大的 CoreML 机器学习框架,开发者都用来做视觉处理了,我就用它做一个文本归类的应用吧,让熊猫可以在手机里安家。

View on AppStore

熊猫吃短信

准确的语义识别

熊猫从庞大的样本中学习到了垃圾短信的文本模式,可以非常准确的从复杂的语义环境中对短信进行分类。比如下图中非常相似的 [京东支付] 的两条短信。

垃圾短信样本

你可以拷贝短信后,在应用里面点击 准确性测试 来测试准确度。

使用非常简单

您只需要安装后打开 设置 → 信息 → 未知与过滤信息 然后选中 熊猫吃短信 即可。熊猫就会默默的帮你吃掉垃圾短信。

关注隐私

熊猫不需要服务器端,不需要联网。应用自带完整的训练模型,使用 CoreML 就可以在手机上对短信进行分类。iOS 11 的沙盒限制也不允许短信过滤器访问网络以及向主 App 共享数据。虽然通过配置项可以让 iOS 11 向自己的服务器上发送短信在云端判断,但是熊猫并没有使用这一功能。

自动进化

熊猫正在飞速成长中,分类准确性依赖于熊猫有没有见过类似的信息。但是世界那么大,总有没吃过的东西,熊猫也有见识浅的时候。基于自愿原则,您可以在应用里面提交新的短信样本喂养熊猫,熊猫会从新的样本中学习到新的垃圾或者正常短信模式。

注意:提交短信样本会将短信匿名上传到服务器上,并非本地训练,熊猫将在云端完成学习,然后分发到所有人的手机上。

关于偏食

由于熊猫是我教的(监督学习),其一定程度上继承了我的喜好,对于有些比较模糊的短信,比如优惠、促销信息,我是一律标记为骚扰短信的。但是有些人可能会喜欢收到此类通知,大家自行取舍。

系统限制

由于 iOS 11 的系统设计原因,被过滤的短信也会显示角标,以及在 Apple Watch 上通知。另外 iOS 11 过滤短信是基于对话的过滤,如果同一个号码既发骚扰短信又发正常短信,那么整个对话都会被过滤。这种现象常见于五位数的号码,但 10 开头的短信发送端口非常少见。

最后

16938 次点击
所在节点    分享创造
191 条回复
qiaoqiao1235
2017-12-04 12:31:57 +08:00
哦,原来 hyper app 也是楼主开发的!
douglas1997
2017-12-04 12:50:03 +08:00
已买,支持一下。
whlvi
2017-12-04 12:59:59 +08:00
已买,支持一下
sobigfish
2017-12-04 13:08:36 +08:00
呃,看了下文档 https://developer.apple.com/documentation/identitylookup
原来上传到网络判断是直接传的(不能脱敏) 但 lz 没有用这个 API
plist 里还是默认的 URL:example-sms-filter-application.com

但是 example-sms-filter-application.com 这个域名被人注册了的,还是有危险的,lz 请尽快修改 ILMessageFilterExtensionNetworkURL
bpsy
2017-12-04 13:11:52 +08:00
已买,支持一下
Tink
2017-12-04 13:14:29 +08:00
这个 666 啊
a554340466
2017-12-04 13:31:43 +08:00
coreML 是怎么训练模型的
whlvi
2017-12-04 13:32:21 +08:00
原来 hyper app 也是楼主开发 除了 hyper ping 还没有购买 剩下包括 cloud speed 也购买了
designer
2017-12-04 13:41:25 +08:00
纯支持,但是这个不给看正脸,只能看背影的熊猫图标不太好看。
准备买楼主的 Hyper App
cloverstd
2017-12-04 13:49:30 +08:00


下面的框太小了
xenme
2017-12-04 13:51:53 +08:00
过滤改不了角标都是垃圾,所以,iOS 平台没有能用的过滤软件
waylybaye
2017-12-04 13:56:43 +08:00
@sobigfish 这个是 Xcode 模板默认的,但只要没加 Associated Domains 就没事……

@a554340466 用别的训练啊,我用的 scikit-learn,我上面的那个链接有 CoreML 支持的库列表。
AsherG
2017-12-04 13:58:01 +08:00
哦!我说怎么上次在我购买的列表里没看到 HyperApp 呢,我还以为我记错了 app 的名字,刚刚在楼主的 app 列表里点了一下才发现原来在国区被下架了
waylybaye
2017-12-04 13:58:05 +08:00
@whlvi 哈哈哈哈,买了我一个,全家桶带回家 😂

@designer 正面细节太多了,我画不来……

@cloverstd 下面的框是可以滚动的~
waylybaye
2017-12-04 14:03:32 +08:00
@AsherG 伤心往事(
iCodex
2017-12-04 14:12:52 +08:00
美区 0.99 美金
forever139
2017-12-04 14:19:14 +08:00
@waylybaye 都快集齐你的全家桶了
Jreen
2017-12-04 14:37:04 +08:00
怎么把误杀的短信(已经在未知与过滤信息)的恢复到联系人普通短信呢?我已经提交了正常短信文本检测…我又不想给 1069 加入通讯录,1069 号段经常变化就没弄通讯录
waylybaye
2017-12-04 14:43:03 +08:00
@Jreen 我 App 里面有说明的,你只要随便回复两条短信(或者 3 条)就出来了 😂
jiangzhuo
2017-12-04 15:18:48 +08:00
测试了 666

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/411764

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX