一个 idea: 用机器学习过滤掉你不想看的邮件

2015-11-06 21:10:46 +08:00
 RangerWolf
现在大部分邮件提供商已经过滤掉一部分的广告邮件, 但是很多时候还是收到很多自己不会进去看的邮件~

自己做了一些机器学习跟 NLP 的项目,感觉可以训练一些模型,根据用户历史看过( y=1 )跟没看过(y=0)的邮件作为训练集训练出一个模型,过滤掉一部分用户不会点击看的邮件~


不知道这种功能有人会喜欢吗?
3747 次点击
所在节点    奇思妙想
19 条回复
9hills
2015-11-06 21:11:29 +08:00
不看的邮件你收它干嘛。。
zhangwei
2015-11-06 21:12:41 +08:00
谷歌有个大概 400 人的团队在做这个事情。。。你一个人搞定了么 TAT
RangerWolf
2015-11-06 21:15:45 +08:00
@zhangwei google 搞的是 for 全人类的,我做的只针对某个人 哈哈~
主要是 google 要处理的东西很多, 这个东西调用一些开源类库的 api 就好了。 我已经站在巨人的肩上了
RangerWolf
2015-11-06 21:16:33 +08:00
@9hills 反正我的网易邮箱各种推送消息啊~ 比如脸书也会跟我推送~
yylzcom
2015-11-06 21:19:08 +08:00
Google 应该已经实现了这样的功能,就是不知道效果是否符合楼主的预期
因为在某邮件里看到“这封邮件在垃圾文件夹里因为你曾经放入垃圾文件夹里”/“这封邮件不在垃圾箱里因为你曾经阅读(打开?)类似的邮件”,用词肯定不准确,不是原话,但是大致如此哈。

当时看到挺震惊的,国内的服务商连最基本的内容过滤都还做不好(光靠关键词进行内容过滤肯定做不好)。
RangerWolf
2015-11-06 21:30:33 +08:00
@yylzcom 其实我虽然常用 gmail ,但是为了方便一直让网易代收进来的
确实不知道 google 有这种功能~ 多谢!
wissen
2015-11-06 23:47:10 +08:00
就是和 Gmail 的 Important 标签差不多吧
oott123
2015-11-07 00:29:58 +08:00
_(:з」∠)_ 难道不是直接贝叶斯完事
pupboss
2015-11-07 00:47:27 +08:00
阮一峰在 11 年就做完了,这算什么 idea
pupboss
2015-11-07 00:48:27 +08:00
chairuosen
2015-11-07 00:55:25 +08:00
地球人会想 “万一过滤错了呢” ,所以每天还是要到垃圾箱翻一翻
RangerWolf
2015-11-07 08:21:47 +08:00
@oott123 算是方法之一啊
RangerWolf
2015-11-07 08:22:24 +08:00
@pupboss 自己的想法放出来就是怕这种自己孤陋寡闻再造轮子 多谢
RangerWolf
2015-11-07 08:22:44 +08:00
@chairuosen 那 google 网易的邮件过滤 也有相同的问题啊
haog
2015-11-07 08:26:47 +08:00
不看的退订或者过滤。这叫 human learning
azuginnen
2015-11-07 09:26:40 +08:00
pg02 年的贝爷撕
zonghua
2015-11-07 10:45:09 +08:00
一点都不智能
yiciyuansky
2015-11-07 18:36:22 +08:00
这种算法只能过滤掉一部分订阅的邮件吧(就是有频率的那种),但是推送的广告才是大家真正不愿意看的邮件。。
Changxu
2015-11-07 19:11:13 +08:00
感觉这个工作像在灌水(科研的角度),当然了一般也就广告不愿意看

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/234269

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX