分享一个 github 上面的神器，真的是神器，不是夸张的。而且搜了一下，基本上是属于世界上没有同类开发的独创软件。感兴趣有能力的网友可以继续跟进开发。 - V2EX

Home Sign Up Sign In

This topic created in 2322 days ago, the information mentioned may be changed or developed.

先说明，这个不是我自己的，只是来分享一下。感觉以后有声书的审核力度持续下去，会变得更加有用。

软件叫 MP3CutAd

自动去掉 MP3 有声读物里面反复出现的片头、片尾、广告。

链接（把“点”改一下）
github 点 com/licstar/MP3CutAd

现在由于版权或者广电总局审核等原因，一些好的有声书被下架。搞得不少用户重新回到自己下载 mp3 有声书进行收听。类似有的歌曲各大 app 被下架，想听就得自己下 mp3。

但是 mp3 有声书里面有个问题就是有一些广告，这个软件的作用就是找出 mp3 里面的广告片段之后进行删除。

用了一下，非常好用，不过原作者已经很多年没有更新了。鉴于本就是 github 上面的开源，不知道有没有感兴趣有能力的作者继续开发。

MP3CutAd

自动去掉 MP3 有声读物里面反复出现的片头、片尾、广告。

使用方法

下载安装（把“点”改一下 pan 点 baidu 点 com/s/1pJ3VmVx ），或者：

下载代码，用 VS 打开，会自动安装一些依赖。
下载 ffmpeg。复制里面的 ffmpeg.exe 和 ffplay.exe 到本项目的 ffmpeg 目录下。
运行。
原理

找到重复出现的广告，然后去掉。

具体步骤如下：

使用 ffmpeg 把 MP3 文件转成 wav 格式。（平均 3~5 秒一个文件）
对 wav 文件做 FFT。（大约 2.5 秒一个文件）
对 FFT 的结果做 LSH。（大约 2.5 秒一个文件）
两两对比，找到相似的片段。（大约 0.35 秒对比一组）
运行时间根据一套有 50 个文件的有声读物实测得到，每个文件包含 20 分钟的录音，测试 CPU 为 i5。总时长为：450 + 2.550 + 2.5*50 + (1+2+...+49)*0.35 = 15 分钟。

TODO

考虑直接对 MP3 做 fft，或许能快点。
目前是两两对比，找重复部分。考虑修改算法，归纳多处出现的广告，优化边界的识别。
FFT+cos 距离这种土办法是不是有高大上的替代方法？
边界判断是不是有高大上的替代方法？
新生成的 MP3 文件，加上原文件的标题、艺术家、专辑等信息。
没发现广告的文件，直接复制原文件过去。
各种重构，各种把参数提到一个地方。

27 replies

1

hljjhb

Mar 12, 2020

6

贴吧？

2

oosjs

OP

Mar 12, 2020 via iPhone

@hljjhb 你这种莫名其妙的回复以后就不要回了。

3

c00WKmdje2wZLrSI

Mar 12, 2020

要是可以去掉视频的片头片尾就好了，比如澳门线上......

4

oosjs

OP

Mar 12, 2020 via iPhone

@c00WKmdje2wZLrSI 他这个是音频啊。视频就靠有没有人继续开发，哈哈。要是好几集都是同样的广告，这个软件是可以对音频进行处理的。

5

oosjs

OP

Mar 12, 2020 via iPhone

@c00WKmdje2wZLrSI 先
通过音频处理找到广告的时间段，再对视频按时间段切割，就可以了哈哈哈

6

lloovve

Mar 12, 2020 via iPhone

Mp3 直接 FFT，FFT 要对原始数据做处理才行，直接对 mp3 做没什么意义吧，毕竟不是人声

7

sakujo

Mar 12, 2020

确实有这个需求

8

Kelan

Mar 12, 2020

切头去尾有什么技术含量，有些声音广告甚至是叠加在原声上的，得能把广告滤掉才行。

9

PbCopy111

Mar 12, 2020

这里可以直接贴 github 的链接吧。。。毕竟是程序员论坛。。。

10

limbo0

Mar 12, 2020 via Android

2

标题党

11

Nadao

Mar 12, 2020

我怎么记得有些播放器带这个功能？

12

learningman

Mar 12, 2020

这个标题实在是太奇怪了

13

also24

Mar 12, 2020

召唤一下之前在 /t/638549 里求方案的 @JCZ2MkKb5S8ZX9pq

14

Citrullus

Mar 12, 2020

@c00WKmdje2wZLrSI 有画面感了😂

15

Meifa

Mar 12, 2020 via Android

我想把视频的明星推荐广告去掉

16

JCZ2MkKb5S8ZX9pq

Mar 12, 2020

@also24 谢谢，我会找时间去试一下。
之前让小朋友帮我手动打了下时间点……

最近在听厚大法考罗翔，有些 up 喜欢自己贴有声头尾是真的烦。

17

loading

Mar 12, 2020 via Android

没查，算法应该可能就是把前面一样的数据全部剪掉。

18

oosjs

OP

Mar 14, 2020 via iPhone

@Kelan 别人原作者写了原理，你都看不懂，看来这个贴子真的不适合你

19

oosjs

OP

Mar 14, 2020 via iPhone

@PbCopy111
真搞不懂，没有眼睛的你，干嘛上论坛

20

oosjs

OP

Mar 14, 2020 via iPhone

@Nadao 不用怀疑，这只是因为你妄想了。而且看不懂原理，也就看不懂其真正的功能

21

oosjs

OP

Mar 14, 2020 via iPhone

@loading 真搞不懂，别人写了原理写了源码。你不愿看就算了，可是为什么还要在这瞎猜呢。

22

oosjs

OP

Mar 14, 2020 via iPhone

@lloovve 感觉直接 mp3 做 fft 也行得通啊。wav 做 fft 和 mp3 做 fft 没有本质区别吧

23

oosjs

OP

Mar 14, 2020 via iPhone

@limbo0 标题党说的是标题和内容不相关。
那你说说，我的标题怎么不想关了。标题一个三个意思，有和内容不相关的吗。

24

oosjs

OP

Mar 14, 2020 via iPhone

@learningman 有什么好奇怪的。标题三点意思。有和内容不相关的吗

25

learningman

Mar 14, 2020 via Android

@oosjs 标题应该简明扼要的概括内容，而不是使用大量含有情绪色彩的词汇。
你上百度查:请问能告诉我如何做一道红烧肉吗？
你看百度理你不

26

oosjs

OP

Mar 14, 2020 via iPhone

@learningman
别人的标题应该怎样还要听你的垃圾规定？
你还是继续活在你的世界里吧。
虽然看不懂你举百度的例子有什么意义。但你的行动都基于百度理不理你，也是够了。

27

Kelan

Mar 17, 2020

脾气这么大干嘛。放轻松一些。自己生气了还让别人也不舒服没什么意思。

About · Help · Advertise · Blog · API · FAQ · Solana · 1105 Online Highest 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 56ms · UTC 18:27 · PVG 02:27 · LAX 11:27 · JFK 14:27
♥ Do have faith in what you're doing.