我是个本科的学生,最近在搞一个语音识别认证的项目。
具体内容大概是这样:
通过读取音频的波形文件,进行采样、滤波、FFT这一系列操作,得到声纹,这个声纹就是由一系列的向量构成,然后把这一声纹和之前库中存放的声纹档案进行比对。实现一个语音认证的过程。这个是软件部分。
硬件部分可能要把这个认证系统用在保险箱上,比如你说一句话,保险箱咔哒就开了。这样看起来视觉效果比较唬人。
现在的问题主要在软件部分,就是怎么样对波形进行处理,得到那个数据结构。这部分我想找一些开源的代码改改用。不过不知道用什么好,请问有什么推荐吗?
具体内容大概是这样:
通过读取音频的波形文件,进行采样、滤波、FFT这一系列操作,得到声纹,这个声纹就是由一系列的向量构成,然后把这一声纹和之前库中存放的声纹档案进行比对。实现一个语音认证的过程。这个是软件部分。
硬件部分可能要把这个认证系统用在保险箱上,比如你说一句话,保险箱咔哒就开了。这样看起来视觉效果比较唬人。
现在的问题主要在软件部分,就是怎么样对波形进行处理,得到那个数据结构。这部分我想找一些开源的代码改改用。不过不知道用什么好,请问有什么推荐吗?