业务时间用 golang 写了个 脏词过滤服务。golang 大法好呀

2016-06-12 08:42:27 +08:00
 laoni

支持多脏词组合 比如: 哇哈哈+蛋蛋蛋 只有同时存在哇哈哈和蛋蛋蛋 才会 hit 到。 还支持简繁体等一般的畸形纠正。 之前用 PHP 和 lua 都实现过。。但性能不行。最后 golang 靠谱

https://github.com/nixuehan/rabbit

golang 大法好呀。 哈哈

3660 次点击
所在节点    程序员
11 条回复
laoni
2016-06-12 08:54:57 +08:00
全部 API 实现,很方便接入自己的项目中

POST /filter

参数: contents=蒙汗药

返回格式:json

具体返回值说明: {"category":"9","categoryName":"违法信息","hit":"1","id":"38509","rate":"2","word":"蒙汗药"}

hit 是否命中, 0 否 1 是 category 脏词的分类 id categoryName 脏词所属分类名 id 脏词 ID,利用这个 ID 就可以编辑脏词 rate 黑名单或白名单, 1 黑名单 2 灰名单(自己 review 内容) word 脏词
fising
2016-06-12 09:18:50 +08:00
老逆你好,这个项目还在呀
laoni
2016-06-12 10:08:11 +08:00
@fising 在呀
pandachow
2016-06-12 11:40:51 +08:00
你可以隔几天再来的。。。。。 https://www.v2ex.com/t/284795
laoni
2016-06-12 13:31:41 +08:00
@pandachow 😅 不好意思
zwh8800
2016-06-12 15:32:38 +08:00
有源码给观摩一下吗😄
laoni
2016-06-12 15:38:33 +08:00
@zwh8800 没什么特别的原理 就是通常的做法 字典树 不复杂 合适的时候我就开源
realpg
2016-06-12 22:12:20 +08:00
@livid 举报 自问自答型 推广 /t/284795


另外对很多人说,自己做个好产品,这里都是程序员,直接发来 github ,老老实实我分享个好东西,多简单点事儿
非得整那些耍猴戏有意思么。
palxie
2016-06-12 23:11:30 +08:00
道高一尺,魔高一丈,中国语言博大精深,过滤这个有点难啊....
laoni
2016-06-12 23:23:38 +08:00
@realpg 这个帖子 我没有 自问自答吧? 当然可以交流更好的 过滤方案
laoni
2016-06-12 23:24:12 +08:00
@palxie 恩是难 但国内环境 没办法把

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/285018

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX