用 Golang 写了一个屏蔽字过滤器,可根据字库判断或替换屏蔽字,一句命令更新字库

2016-10-08 21:20:15 +08:00
 goofansu

项目地址: https://github.com/repong/hope_word

关于项目

这是一个基于 sego 的屏蔽字过滤器

用法

go get -u github.com/repong/hope_word
hope_word -port 8000

例子(请把测试看看改为dict/assets/文件夹中的屏蔽字)

curl -XPOST http://localhost:8000/validate -d "message=测试看看"
{"result":"false"}

curl -XPOST http://localhost:8000/filter -d "message=测试看看"
{"result":"**看看"}

更新字典

make update_dict

PS

用 travis 自动编译并提交到 Github 上,在 Releases 标签中选择版本即可使用,支持 linux 系统。

使用了 go-bindata 把 txt 文件一起打包了,方便部署。

游戏审核要用,没办法,我也不想搞屏蔽字的 : (

4672 次点击
所在节点    分享创造
22 条回复
est
2016-10-08 22:01:51 +08:00
LZ 文明用语。
goofansu
2016-10-08 22:18:30 +08:00
@est 哈哈,真会玩
ivvei
2016-10-08 23:55:05 +08:00
看标题的时候还以为是把**替换为文字呢…… 点开才发现彻底理解反了。
goofansu
2016-10-08 23:58:40 +08:00
@ivvei **替换成文字也太牛 X 了吧
skycham
2016-10-09 00:31:17 +08:00
我点完感谢 /收藏之后才发现是把汉字变成**,我还以为是把**变成汉字。我在想能把**正确的变成汉字,得微软小冰这种级别吧,还不一定行。
goofansu
2016-10-09 00:53:18 +08:00
@skycham 标题有那么不清晰吗,不只你一个人看错了
skycham
2016-10-09 07:03:03 +08:00
@goofansu 我猜,大家,内心呼唤**变汉字很久了。
goofansu
2016-10-09 08:37:28 +08:00
@skycham 哈哈,无奈啊
flyingfz
2016-10-09 12:05:26 +08:00
在电脑上 搭一个 go 环境挺麻烦的,
想问问这个情况: “欢迎进群交流,群号: 1234567890. ” , 是什么样的响应?
如果是: “欢迎进**流,群号: 1234567890.” , 那就没什么意思了。

昨天正好看了一篇这个领域的文章,感觉这个领域水很深。。。。
goofansu
2016-10-09 12:19:28 +08:00
goofansu
2016-10-09 12:20:29 +08:00
@flyingfz 这个可以设置词频的,比如交流是 3 ,群交是 2 ,就不会匹配到后者
flyingfz
2016-10-09 14:17:58 +08:00
感谢。

如果能把 readMe 完善一下, 就更好了。
flyingfz
2016-10-09 14:18:13 +08:00
goofansu
2016-10-09 16:41:41 +08:00
@flyingfz 好的,有空了写,最近游戏要上线了比较忙
pandachow
2016-10-10 00:42:48 +08:00
多模匹配啥做的, AC 自动机吗还是 wumanber ?
goofansu
2016-10-11 10:16:17 +08:00
@pandachow 我也不知道,你可以看下 sego ,我只是照文档用顺便打包
goofansu
2016-10-11 20:42:55 +08:00
@flyingfz macOS 可以直接下载 0.1.1 的 release 测试,具体看主题里第二条 Append
goofansu
2016-10-14 12:05:20 +08:00
flyingfz
2016-10-14 12:11:44 +08:00
@goofansu 非常感谢, 有心了。
goofansu
2016-10-14 12:17:56 +08:00
@flyingfz 哈哈,应该的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/311240

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX