如何识别 b 站某个视频质量,并提取出优质视频链接

2020-05-16 10:44:24 +08:00
 greenhat233

现在很多时候会去 b 站搜索视频学习,但是搜到的基本都是培训机构的视频,所以萌发了想提取出优质视频的想法,爬取弹幕,评论,播放量什么的应该没什么问题,关键是这个识别算法,不知道怎么弄

所以想问下 v 友们,识别 b 站某个视频质量应该怎么搞,是直接关键词判断什么的,还是有专门的这样一种机器学习算法,不知道是不是这种 https://www.infoq.cn/article/9PJVW5Ef5KsbubzJccPd

同时还想问下,如果涉及到机器学习,成本是不是有点高,因为没有接触过机器学习

1778 次点击
所在节点    问与答
7 条回复
murmur
2020-05-16 10:48:44 +08:00
你的试看,b 站都是搬运的盗版视频,总有能搬到优质资源
另外,培训班的视频不是一无是处,他讲的概念可能达不到术语标准,但是基本都是要做代码演示的,如果瞎讲演示就要翻车
M3ng
2020-05-16 11:00:50 +08:00
质量的定义是什么,每个人的定义都不一样何况机器。浏览量、弹幕数与评论数这些至少能说明受欢迎程度。
lyminghao
2020-05-16 11:02:51 +08:00
基于学习的思路就别想了,需要获取大量标注数据来训练,个人 /小团队很难实现。
还是基于规则现实一点,拟合一下播放量、点赞投币、评论弹幕,弄个打分函数。
em70
2020-05-16 11:04:06 +08:00
机器学习可以发现人无法总结的规律,但参数维度要足够多才行
chocovon
2020-05-16 11:25:34 +08:00
特意去查了一下,这都是画面质量上的评估吧……
zero469
2020-05-16 14:24:01 +08:00
建议直接用播放量、弹幕数、点赞数这些数据拟合一个得分,然后根据得分高低选视频
dingwen07
2020-05-17 09:57:00 +08:00
硬币数除以点赞数
越高的视频质量越好

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/672271

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX