弄了一个公众号: 利用人工智能分析过滤电商评论

2018-05-02 04:41:12 +08:00
 ZYJ

大家好,我和几个小伙伴开发了一个基于人工智能,机器学习的工具, 名字叫"评论小助手", 尝试解决电商评论里存在的一些问题.

先介绍一下我们主要想解决的问题:

无论是卖家还是买家都觉得评论对于商品的销量起着很大的作用. 所以商家会积极鼓励买家对商品进行评论, 其中包含正当或者不正当的手段. 由此造成热销商品有着大量的评论,对于现潜在用户来讲,漂亮的评论数据看起来很美, 基本上都是极高甚至是 5 星的好评. 但是产品真如评论分数所表示的那么好么? 想通过看看评论来考查商品, 却苦于评论太多, 而且真假难辨, 看起来很费时间.

我们认为用户真实的需求是需要一个工具来把评论中的 noise 去除掉, 当然假评论也属于 noise 评论.

我们的方法:

通过分析大量的用户评论, 我们发现虽然评论数量很多, 但对于用户有参考意义的并不是很多, 我们觉得可以通过机器学习的方式来过滤评论, 从而让用户可以更加容易的查看评论.

目前我们会过滤以下评论:

  1. 评论不是针对商品的. 比如: 老板人很好, 快递不错等.
  2. 重现评论很高的评论. 类似的评论在不同的产品反复出现的. 我们认为这些评论对于购买参考意义不是很大.
  3. 疑似刷单的评论. 单从一个产品里可能无法看出来, 但我们考虑到刷单为了成本考虑, 会将类似的评论运用到其他产品. 所以将大量产品的评论放在一起通过大数据分析和机器学习来看的话, 可以发现一些规律.

同时我们还会对一些评论增加权重, 比如虽然打的是 5 星好评, 其实看内容却发现用户想表达的意见是差评.

根据我们的测试结果, 通过过滤后, 剩下的评论比例大约在 2-3%之间.

工具使用方式:

说了这么多, 怎么用这个工具呢? 我们目前通过微信服务号的方式来提供服务, 小伙伴们只要将要查看的产品链接通过服务号来发送给我们, 我们就会将分析结果以消息的方式回复给你.

请注意: 由于现在还在刚起步阶段, 提供的服务比较有限.

  1. 现在我们只支持分析京东上的服饰类产品, 其他类别的支持还在进行中
  2. 由于分析产品涉及实时抓取评论, 所以会需要一些时间, 一般来说如果要查询的产品我们还没有分析过, 那么需要大约等待一分钟左右, 但你可以一次发送好几个需要分析的链接以缩减等待时间. 但如果要查询的产品我们已经分析过了, 那么恭喜你, 马上就能拿到结果:)

大家可以通过扫描二维码或者在公众号中搜索"评论小助手"来使用这个工具.

下面简单介绍下具体使用步骤:

最后, 谢谢你有耐心看到这里, 如果你觉得有点, 欢迎试用. 当然更重要的, 如果你有什么意见, 欢迎留言.

5132 次点击
所在节点    分享创造
37 条回复
chniccs
2018-05-02 09:03:30 +08:00
感觉是把差评都选出来了
ZYJ
2018-05-02 09:16:07 +08:00
也不是所有的差评, 但是差评的权重值会稍微高一点
natforum
2018-05-02 10:39:31 +08:00
专门看差评?
olbb
2018-05-02 10:47:13 +08:00
这样用起来太麻烦了 感觉做成 chrome 插件会好用很多
ZYJ
2018-05-02 10:49:38 +08:00
@natforum 不是的 都会看的 过滤后的评论里 有不少是好评里选出来的
ZYJ
2018-05-02 10:51:00 +08:00
@olbb chrome 插件 en 也在考虑中 主要是觉得大部分人都在手机上用 pc 用的人不多
Shura
2018-05-02 12:16:49 +08:00
@ZYJ 我还是喜欢在 PC 上进行购物,看评论、看图片、看参数、比价格都很方便。
ZYJ
2018-05-02 12:28:18 +08:00
@Shura @olbb 谢谢你们的意见. 看来 chrome 的插件势在必行
awolfly9
2018-05-02 13:10:24 +08:00
感觉和我之前撸的一个轮子很像。

http://awolfly9.com/article/jd_comment_analysis
awolfly9
2018-05-02 13:11:18 +08:00
线上实时分析: http://awolfly9.com/jd/
xgzxy
2018-05-02 13:15:08 +08:00
这个到最后是不是也要走,淘宝推荐环节?开始招代理,做猫腻,变相售物
ZYJ
2018-05-02 13:17:23 +08:00
@awolfly9 你给的网页打不开, 不过看到你 github 上的项目了, 我们的理解是差不多的 //hand
ZYJ
2018-05-02 13:19:51 +08:00
@xgzxy 还没想这么远. 不过 我认为, 消费者是聪明的, 很容易看出来你是站在哪一面. 我觉得愚弄用户没什么好下场.
mengdisheng
2018-05-02 13:21:45 +08:00
@awolfly9 擦 6666 啊 开源吗
xgzxy
2018-05-02 13:24:02 +08:00
@ZYJ 那你做这个,真的为了情怀,还是为了提高技术?
awolfly9
2018-05-02 15:44:07 +08:00
@mengdisheng 已经开源了,在我的 github 可以看到源码


@ZYJ 可以打开的
ZYJ
2018-05-02 16:28:00 +08:00
@awolfly9 现在可以打开了 看了下 侧重点有点不一样。你的工具用了它评论及其附带的一些 metadata 来分析 数据 很不错的思路
gamecreating
2018-05-02 18:32:59 +08:00
主要看后续 AI 强不强大....
find
2018-05-02 22:53:44 +08:00
它属于监督 还是强化呢?你的训练数据哪里来的呢 ?
WildCat
2018-05-03 04:08:41 +08:00
@awolfly9 老铁,你 GitHub 多少?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/451318

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX