Python 有什么 [音频比较] 的轮子推荐嘛?

2020-01-16 20:36:49 +08:00
 JCZ2MkKb5S8ZX9pq

需求

5085 次点击
所在节点    Python
27 条回复
no1xsyzy
2020-01-17 12:54:36 +08:00
首先,因为有编码肯定是在频域内处理才行
听觉心理学?测算心理音量设阈值作启发
频谱算 corelation ?
JCZ2MkKb5S8ZX9pq
2020-01-17 13:03:59 +08:00
@no1xsyzy 不是音量的问题 是内容匹配
JCZ2MkKb5S8ZX9pq
2020-01-17 13:05:21 +08:00
@JCZ2MkKb5S8ZX9pq 比如片头会有一段烦人音效,或者片尾推荐几分钟公众号。
no1xsyzy
2020-01-17 13:25:01 +08:00
@JCZ2MkKb5S8ZX9pq
> 无奈片头片尾贴片广告太多了,音量都暴大
“音量” 是作为特征而非目标
做成音量启发式,那样的话可以只搜十秒不到,那每秒 30 采样问题也不大。

如果这样效果不好,就是频域内选个四五条线做 corelation,你甚至不需要专门采样比对
JCZ2MkKb5S8ZX9pq
2020-01-17 13:36:27 +08:00
@no1xsyzy 可是音量无法作为特征,因为几百段里,也有贴片的音量正常的,或者节目中途又加了其它音效的。情况比较复杂,音量大只是出现在一部分片头上。
cshlxm
2020-01-17 14:18:15 +08:00
一段音频用 vad 检测算法,分离出音频段,调用语音转文字接口,转一部分文字出来,分词,做文本相关性分析,把相关系数高的文字对应音频找出来即可
Ukenn
2022-08-09 14:17:35 +08:00
@JCZ2MkKb5S8ZX9pq 你好,请问能分享一下你写的么,看了许多完全没有头绪想参考一下,匹配到开始对我来说足够了,由于我项目广告的时间是固定的,我想加上广告时长应该就可以匹配到结尾了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/638549

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX