|      1XanderChen      2020-04-04 13:43:58 +08:00 emmmm...找个厉害的音频编辑软件,看看有没有独立音轨?然后提取出来? (是不是叫音轨?有错请指正。) 大概就能想到这方法。还是你想用代码写个提取的工具,ffmpeg 看看有没有相关的方法? 如果没有独立音轨...emmm... 那就等大佬的方案吧... | 
|  |      2JerryCha      2020-04-04 14:52:57 +08:00  1 不知道 大概频域处理吧,两个人的说话声音肯定不一样,响度也可能不一样 当然各自独立一条轨道肯定最容易处理 | 
|  |      3V69EX      2020-04-04 14:57:10 +08:00 像 youtube 用的那种语音转字幕的软件,应该可以,字幕上有时间,根据转换后的文字是中文还是英文来反过来将视频分片。 | 
|  |      4V69EX      2020-04-04 14:57:48 +08:00  1 就算软件只能识别英文也没问题,不能识别的就当中文了。 | 
|  |      5llj5935      2020-04-04 15:10:50 +08:00  1 讯飞听见的语音技术可以识别中文中夹杂的英文单词,说明其算法能力具备识别中英文的功能。但是他们还没有做剪辑剥离,相信既然能识别,做剥离是很简单的了。 | 
|      6cnleoyang OP | 
|      8diggerdu      2020-04-04 15:31:38 +08:00 via iPhone  1 如果不是一个人说过的可以先做 speaker diarization | 
|      12w1573007      2020-04-04 16:52:01 +08:00 via Android  1 开源项目:spleeter 。主要是音频人声分离,不过这个主要是对音乐中的人声进行提取,生成干音。楼主可以试试,我用它分离干音品质可以进行重新混音 | 
|  |      15300      2020-04-04 21:55:00 +08:00 你这个 idea 实现起来有点 difficult 啊 | 
|      16CaiXiaobai      2020-04-04 22:09:05 +08:00 科大讯飞有 声音识别转文字,你值得拥有 | 
|  |      17liuzhiyong      2020-04-05 13:25:26 +08:00 同意楼上的,这方面科大讯飞比较猛,用过他们的 TTS,非常牛。 |