先说明,这个不是我自己的,只是来分享一下。感觉以后有声书的审核力度持续下去,会变得更加有用。
软件叫 MP3CutAd
自动去掉 MP3 有声读物里面反复出现的片头、片尾、广告。
链接(把“点”改一下)
github 点 com/licstar/MP3CutAd
现在由于版权或者广电总局审核等原因,一些好的有声书被下架。搞得不少用户重新回到自己下载 mp3 有声书进行收听。类似有的歌曲各大 app 被下架,想听就得自己下 mp3。
但是 mp3 有声书里面有个问题就是有一些广告,这个软件的作用就是找出 mp3 里面的广告片段之后进行删除。
用了一下,非常好用,不过原作者已经很多年没有更新了。鉴于本就是 github 上面的开源,不知道有没有感兴趣有能力的作者继续开发。
MP3CutAd
自动去掉 MP3 有声读物里面反复出现的片头、片尾、广告。
使用方法
下载安装(把“点”改一下 pan 点 baidu 点 com/s/1pJ3VmVx ),或者:
下载代码,用 VS 打开,会自动安装一些依赖。
下载 ffmpeg。复制里面的 ffmpeg.exe 和 ffplay.exe 到本项目的 ffmpeg 目录下。
运行。
原理
找到重复出现的广告,然后去掉。
具体步骤如下:
使用 ffmpeg 把 MP3 文件转成 wav 格式。(平均 3~5 秒一个文件)
对 wav 文件做 FFT。(大约 2.5 秒一个文件)
对 FFT 的结果做 LSH。(大约 2.5 秒一个文件)
两两对比,找到相似的片段。(大约 0.35 秒对比一组)
运行时间根据一套有 50 个文件的有声读物实测得到,每个文件包含 20 分钟的录音,测试 CPU 为 i5。 总时长为:450 + 2.550 + 2.5*50 + (1+2+...+49)*0.35 = 15 分钟。
TODO
考虑直接对 MP3 做 fft,或许能快点。
目前是两两对比,找重复部分。考虑修改算法,归纳多处出现的广告,优化边界的识别。
FFT+cos 距离这种土办法是不是有高大上的替代方法?
边界判断是不是有高大上的替代方法?
新生成的 MP3 文件,加上原文件的标题、艺术家、专辑等信息。
没发现广告的文件,直接复制原文件过去。
各种重构,各种把参数提到一个地方。
软件叫 MP3CutAd
自动去掉 MP3 有声读物里面反复出现的片头、片尾、广告。
链接(把“点”改一下)
github 点 com/licstar/MP3CutAd
现在由于版权或者广电总局审核等原因,一些好的有声书被下架。搞得不少用户重新回到自己下载 mp3 有声书进行收听。类似有的歌曲各大 app 被下架,想听就得自己下 mp3。
但是 mp3 有声书里面有个问题就是有一些广告,这个软件的作用就是找出 mp3 里面的广告片段之后进行删除。
用了一下,非常好用,不过原作者已经很多年没有更新了。鉴于本就是 github 上面的开源,不知道有没有感兴趣有能力的作者继续开发。
MP3CutAd
自动去掉 MP3 有声读物里面反复出现的片头、片尾、广告。
使用方法
下载安装(把“点”改一下 pan 点 baidu 点 com/s/1pJ3VmVx ),或者:
下载代码,用 VS 打开,会自动安装一些依赖。
下载 ffmpeg。复制里面的 ffmpeg.exe 和 ffplay.exe 到本项目的 ffmpeg 目录下。
运行。
原理
找到重复出现的广告,然后去掉。
具体步骤如下:
使用 ffmpeg 把 MP3 文件转成 wav 格式。(平均 3~5 秒一个文件)
对 wav 文件做 FFT。(大约 2.5 秒一个文件)
对 FFT 的结果做 LSH。(大约 2.5 秒一个文件)
两两对比,找到相似的片段。(大约 0.35 秒对比一组)
运行时间根据一套有 50 个文件的有声读物实测得到,每个文件包含 20 分钟的录音,测试 CPU 为 i5。 总时长为:450 + 2.550 + 2.5*50 + (1+2+...+49)*0.35 = 15 分钟。
TODO
考虑直接对 MP3 做 fft,或许能快点。
目前是两两对比,找重复部分。考虑修改算法,归纳多处出现的广告,优化边界的识别。
FFT+cos 距离这种土办法是不是有高大上的替代方法?
边界判断是不是有高大上的替代方法?
新生成的 MP3 文件,加上原文件的标题、艺术家、专辑等信息。
没发现广告的文件,直接复制原文件过去。
各种重构,各种把参数提到一个地方。