有什么办法可以批量根据 mp3 内容快速分类的

2022-06-23 08:45:14 +08:00
 fyxtc
每个 mp3 音频大概 10 秒左右,需要人听才能分类到 1,2,3
人工操作就是把所有 mp3 拖到播放器然后播一个,再去文件管理器复制粘贴,得弄死

目前想到一个思路自己写脚本命令行逐个播放( ffmpeg?),然后根据听到的内容(不用听完,可能 3 秒或 5 秒就能分辨)按键盘 1,2,3 直接打断播放(监听键盘事件然后打断当前播放并播放下一个)然后复制到对应分类文件夹

这个思路行得通吗,大家还有更好的工具或者思路吗
1632 次点击
所在节点    问与答
22 条回复
Soar360
2022-06-23 09:21:11 +08:00
语言转文字,分词,然后自动归类?
0x2CA
2022-06-23 09:21:54 +08:00
行的通,但是你开发一个花费时间找就分好了,除非你量大,而且后面经常用
shilianmlxg
2022-06-23 09:31:44 +08:00
不如用 sony 的 mediago 。记得它的分类是自带。只是解析很慢
jhjguxin
2022-06-23 09:41:18 +08:00
写个程序主要做下面几件事情
第一步遍历需要处理的文件列表
第二步截取每个文件的前 10 秒(如果文件数量并不大,长度也小可以忽略此步骤)
第三步调用类似科大讯飞语音转写 API 接口( https://www.xfyun.cn/doc/asr/lfasr/API.html
第四步在提取出的文字中匹配你所需的分类关键字,如果成功进行第五步
第五部根据匹配到的关键字将对应文件进行分类处理
第六步将前面第 2-5 步操作失败的文件单独标记进行人工处理即可
snoopyhai
2022-06-23 10:01:39 +08:00
网上有语音质检的能力. 找找看. 能不能基于质检去做一些特别设定.
fyxtc
2022-06-23 10:02:55 +08:00
@0x2CA 量大,几千个
darkengine
2022-06-23 10:08:07 +08:00
speech to text ,再接个自然语言处理,然后分类
fyxtc
2022-06-23 10:13:00 +08:00
@Soar360
@shilianmlxg
@snoopyhai
@jhjguxin


感谢提供建议,不过分词是铁定不行的,有时候还需要联系上下句语义才能处理,而且有的还包含外语,所以只能人工听才能分。
Buges
2022-06-23 10:29:14 +08:00
如果隐私能接受,直接买讯飞的转文字(中文)
tfdetang
2022-06-23 11:00:29 +08:00
突然让我想到前段时接很火的那个电视剧 <人生切割术>

其实我很好奇,人是怎么分类的? 标准是什么? 因为只要听 10 秒 感觉应该也不是特别复杂的上下文理解

其实用 AI 分类不一定非要转文字啥的,也可以直接拿着音频数据作为一个序列信息来进行分类啊。 也不需要写任何规则只需要先人工分一部分数据就行了。

只是一共就几千条数据上 AI 显然是不太划算的,得是一个持续性的长期工作才有价值
Juszoe
2022-06-23 11:21:13 +08:00
几千个还是人工处理吧,但 OP 有些小看 AI 了,这种分类是标准的 AI 适用场景,不需要写规则,打上类别标签就好了,难点就在于数据集要自己收集。
如果要求 100%准确率,可能 AI 确实不合适
wudicgi
2022-06-23 11:43:18 +08:00
如果机器识别不可行的话, 楼主需要的是一个可以在界面上当场进行文件重命名操作的音频播放器?
yufeng0681
2022-06-23 12:14:01 +08:00
原始诉求 还得往前回溯。 目前看是你想要的一个解决方案。
1 、如果是长期工作,能不能让负责提供素材的人,就按照要求格式提供素材;
2 、如果是自己采集的素材,也是临时工作,那就看看有没有其他规律可以寻觅,不行的话就只能人工分拣。
3 、人工分拣,建议用阿里云盘。 它能在线播放音频。
3.1 你听到 1 类的,你就收藏, 进入收藏库
3.2 你听到 2 类的,你就下载,再次下载到本地目录 2
3.3 如果是 3 累的,你不用处理, 等全部处理完毕, 把收藏 1 类的下载到本地第二个目录 1
3.4 你把本地音频和下载的 1 2 类音频 放一起,全部排序,按同名排序,把孤单的 3 类文件,ctrl 选中,然后复制一份到新的目录 3 里, 就成了。
yufeng0681
2022-06-23 12:16:29 +08:00
注 :阿里云盘的音乐播放界面, 有上一项,下一项, 收藏,下载,分享,按钮。

重命名和移动按钮在 more 里面,要多点击一下,麻烦。。
fyxtc
2022-06-23 12:48:34 +08:00
@yufeng0681 谢谢,很有收获。我试了一下云盘下一项的时候并不会自动播放而是顺序播完才播的下一项,而且按空格也不会触发播放,这一点挺难受的,不知可有解决方案。
libook
2022-06-23 14:49:05 +08:00
加个撤销机制以防按错,然后我觉得就可以做个 MVP 方案让负责分类的人员试用一下了,看是否提升了效率,然后根据反馈再优化。
dddd1919
2022-06-23 14:51:53 +08:00
100 块钱,雇个人
yufeng0681
2022-06-23 16:38:05 +08:00
@fyxtc 感觉是阿里云盘的一个 bug ,或者说体验不合理的地方, 要不给阿里云盘提个问题单,让他修复一下?

下一项,如果不想动。 那就在播放器那边增加 上一曲,下一曲 的功能,切换快捷键 是 播放器的必须项目。
XimuTao
2022-06-24 10:10:20 +08:00
根据按键分类这个思路, 我写过一个用来分类图片的[photo-classification]( https://github.com/ximu-tao/photo-classification), 需要的话我可以帮你改一个音频版本的
fyxtc
2022-06-24 11:11:48 +08:00
@XimuTao 看了下,很适合我的需求,我如果你有时间弄的话,那就太感谢了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/861533

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX