有没有什么根据音频对话区分说话者的工具

2 天前
 Frankcox
我想找一个工具,可以尽量区分对话中不同人物,根据人物进行音频分割。如果做不到这种层次,简单区分男女声进行分离的也可以。
485 次点击
所在节点    问与答
11 条回复
wweerrgtc
2 天前
语音转文字的工具, 都可以区分是谁在说话
fengci
2 天前
一些公司的成品,有会议记录功能,都有看到这个功能。
Frankcox
2 天前
@wweerrgtc Whisper 命令行直接运行可以进行区分吗?我之前用 whisper 只语音转文字过,没试过区分。
fengci
2 天前
@fengci 好像最近发布的手机 支持 AI 的 都支持好像。
Frankcox
2 天前
@fengci #4 我主要还是想运行在 PC 上,同时执行其他代码逻辑
raydied
2 天前
模仿飞书或腾讯会议吗?一般用声纹识别的方案。
Frankcox
2 天前
@raydied 不是商业或者公司方面,单纯个人玩的项目,所以想找些本地能跑的开源方案。
cyp0633
2 天前
whisper.cpp 应该支持 NER ,但应该是需要搭配特定模型的,然后还有这篇文章 https://arxiv.org/abs/2409.08107 或许也相关
sighforever
2 天前
阿里出的 funasr 工具包
mumbler
2 天前
就是说话人识别,用 whisperX, win 桌面直接用 https://github.com/Purfview/whisper-standalone-win 即可,Faster-Whisper-XXL.exe 命令行工具,免安装部署
yelc668
2 天前
好像目前 ai 就阿里做的还可以,还免费 叫通义听悟

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1092292

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX