如何增加听歌识曲的识别率

2016-06-24 22:30:41 +08:00
 vvtoo
soundhound, shazam, google 和网易对以下这段
https://www.instagram.com/p/BG9-xDUoh7d/
都没有识别成功。
用编辑软件对音频做了一些简单的编辑,去对话,加一些拼接,还是没有成功。
请问有什么好办法对一些时长较短的歌曲片段进行识别吗?
编了那么多理由,有高手知道链接里的歌曲叫什么吗...
谢谢!
1606 次点击
所在节点    问与答
7 条回复
fcicq
2016-06-24 22:45:41 +08:00
虽然没听楼主贴的是什么, 不过识曲做的是和现有库中的相似度识别, 而不幸的是这些系统的设计者根本就不了解乐理就把问题基本搞定了, 就和现在做机器翻译的专家也不是语言学家一样.
rubytek
2016-06-25 09:29:09 +08:00
@fcicq 这叫幸运。我每开除一个语言学家,语音识别的准确率就上升一点。
Aquamarine
2016-06-25 11:22:53 +08:00
估计可能是人声太强,背景音太弱,所以不好识别,建议楼主消除人声试试。
不过背后这段音乐是已有音乐么?而不是为了电影专写的配乐?
fcicq
2016-06-25 13:06:18 +08:00
@rubytek 你说的这确实是事实. 但是不懂乐理的声音搜索不太可能搜索到原唱以外的歌曲.
rubytek
2016-06-25 13:19:00 +08:00
@fcicq 目前主流的原声和哼唱识别算法都是基于音频特征提取后进行检索的,跟乐理没有半毛钱关系。就好像懂棋理的人赢不了阿法狗一样,像棋理、乐理这种在垂直领域内积累了不过数千年的所谓规则,不过是人类这个群体的一点点小经验罢了。放在宇宙长河中,如同过家家一般。
rubytek
2016-06-25 13:21:42 +08:00
@vvtoo 比较难处理,你可以试着按视频中人声部分的频率进行滤波,把背景音乐提出来(效果不一定好,伴奏提取本来就是技术难点。而且这个视频内容太杂了,不仅仅是唱歌)。然后调用下原声检索的 API 即可。
fcicq
2016-06-25 13:26:39 +08:00
@rubytek 但是有音感的人可能就那么不喜欢用了. 最近个人好像有了一点根据和弦序列识曲的能力, 因为用现成服务注定搜不到是很有压力的. 有极少数软件确实支持这件事, 但是小众需求就没人管了.

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/288152

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX