[求助] 过滤弹幕 的工具? pakku 的补充?

2018-03-21 10:04:45 +08:00
 o0OoO0o

以前,楼主一概关闭弹幕,不但无意义的吵架抬杠太多,而且遮挡视野、干扰观看

后来,还是有看弹幕的需求:
• 比如看综艺,突然一首 bgm 很好听,想知道是什么歌,用 shazam 等工具太慢了,而且有人声干扰识别,而弹幕里往往有人已经说了音乐名字,很方便
• 又比如画面里有只很奇怪的动物,蛮好奇是什么,去查也不知道怎么查,而看下弹幕,往往就有人告诉是什么动物
——总结下,这种“资讯型弹幕”是俺需要的,因为提供的,是货真价实的讯息

相反,像下图中的红圈弹幕,都是发表感受、喜好的感叹词,这种“感受性弹幕”,又是俺希望屏蔽的(别误会,并没有批评这类弹幕,只是俺个人不需要,所以希望眼不见为净而已):

目前在用 pakku+云推荐弹幕,但效果距离满意还很远

所以请问下,有能够区分这两者弹幕、并屏蔽后者的工具么?

(当然这两种弹幕,不是黑白分明的,比如“笑起来好甜啊”,资讯和感受各占一点。但总之,区分不清的可以搁置不处理,只处理明显的感受性弹幕,就能减少≈30%弹幕数量了,有这种工具么?)

1091 次点击
所在节点    问与答
4 条回复
sola97
2018-03-21 11:01:59 +08:00
正则屏蔽,单字符连续重复 3 次以上都可以屏蔽了,咆哮体哈哈哈 233333 之类的
sola97
2018-03-21 11:13:10 +08:00
结尾是感叹词或标点符号的短弹幕 , 也可以考虑屏蔽
o0OoO0o
2018-03-21 11:15:38 +08:00
@sola97 #2 谢谢朋友,俺目前在用 https://github.com/jnxyp/Bilibili-Block-List
但距离满意仍有距离。现阶段,或许只能手动添加了
caomu
2018-03-21 11:18:01 +08:00
估计需要邮件过滤器级别的语义识别+贝叶斯,还要语料库和训练。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/439960

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX