如何编写一个通用的视频搜索引擎?

2013-06-24 11:23:50 +08:00
 dingyaguang117
所谓“通用”就是可以抽取不同网站,不同结构页面的视频信息(标题,截图,描述,剧集播放页列表)。

我想知道百度视频搜索是怎么做到的?难道是针对各大视频网站的不同页面的结构编写不同的抽取程序吗?不然是怎么做到精准的信息抽取的。
2407 次点击
所在节点    问与答
3 条回复
luikore
2013-06-24 11:32:44 +08:00
在人力资源丰富的国度, 思路就是这样:
招 100 个程序员, 针对数据量前 100 的视频网站写不同的抽取
招 1000 个运营, 手工录入 100 以后的视频网站上的信息
dingyaguang117
2013-06-24 11:43:30 +08:00
@luikore = =那百度视频,快手看片等等 都是这么做的吗?
jjplay
2013-06-24 12:12:50 +08:00
百度视频 都是第一索引自己的站 爱奇异 -> 百度影音 -> 奇热 ,优酷 土豆 ..... 前面自己站数据调用,后面大站肯定都是战略合作,毕竟谁都想和百度合作 引流巨大 不就是钱么,最后面应该是自己的算法识别 和一定的人工,差不多这样吧,百度视频 soku.com 都有递交视频的规范 当然收录几率几无

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/73411

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX