sitiao's recent timeline updates
sitiao

sitiao

V2EX member #77103, joined on 2014-10-14 14:00:09 +08:00
sitiao's recent replies
@mdluo 说的是对的,那个库适合做音频指纹检索,对这个 case 不太适合。
1. 把跳绳的声音一段段切出来,10 段~20 段就可以了,作为模板;模板越多越好;最好选取不同人、不同跳绳的录音;
2. 模板片段提取 MFCC 系数,每个片段的 MFCC 系数做一下平均,作为整个片段的模板;多个模板可以再以下聚类,缩减一下模板数量,假设最后剩下 N 模板。
3. 测试片段的 MFCC 特征序列与 N 模板算一下余弦相似度,每个 MFCC 系数与任意一个模板的相似度超过阈值 t1,则标记为 1,未超过的标记为 0 ;
4. 对测试片段标记为 0~1 的序列做一个 5~10 点平滑,基本就可以用了。

比较简单粗暴,估计误识别会很高。
Feb 1, 2018
Replied to a topic by enenaaa 程序员 怎样判断一个人写代码的天赋?
见过没有写代码没有天赋,但是却很喜欢 IT 的。
券商里面技术这么激进的,应该是广发吧!
参考唐凤 +1
Jul 11, 2016
Replied to a topic by chengfu 程序员 关于声形码的思考
去搜一个 app 叫 Chirp ,用鸟叫声传输 url ,可以搜到它的原理说明。真实应用场景下,识别效果会很差。其实阿里的声音近场支付用的原理和这个一样。
Dec 14, 2015
Replied to a topic by cevincheung PHP 有木有玩过 ffmpeg 的童鞋?
用 C/C++写一个 PHP 的扩展,在扩展里面掉 ffmpeg ,应该就可以实现交互了。
Dec 11, 2015
Replied to a topic by Counter 程序员 哪种编程语言最适合做图像识别?
楼上的是正解。
网银的代扣接口支持 100w 的支付。
你要找的不是程序员,先找技术总监或者产品经理,也可以同时找小的外包公司先把东西做出来。
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3561 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 63ms · UTC 10:36 · PVG 18:36 · LAX 03:36 · JFK 06:36
♥ Do have faith in what you're doing.