分享一个 chrome 日语语音离线识别, Python 代码本地调用动态库实现

145 天前
 siluplsy

here:

https://huggingface.co/datasets/dlxjj/soda_jp_success_call

目前只支持日语,是因为旧版的其他语言模型已经下载不到了。

Linux: 
/home/$USER/.config/google-chrome/SODA/1.1.1.7
windows:
C:\Users\%USERNAME%\AppData\Local\Google\Chrome\User Data\SODA\1.1.1.7\SODAFiles
C:\Users\%USERNAME%\AppData\Local\Google\Chrome\User Data\SODALanguagePacks
	# 语言包和 dll 在这里

关于最新版的 windows dll 调用方法还有待研究。

1330 次点击
所在节点    程序员
5 条回复
kxg3030
145 天前
谢谢分享 看看以后能不能用到
Armor
145 天前
语速很快的情况下,可以识别吗?🐶
iorilu
145 天前
怎么个用法

和 chrome 有啥关系

有文章介绍怎么用贴一个吗
SHF
145 天前
我最近玩了下 https://github.com/SYSTRAN/faster-whisper ,可以勉强用用。
还有 windows 的快捷键 ctrl + win + l 可以离线实时识别,效果也挺好,就是内容不能复制,急求复制方案,要是能复制就好了

siluplsy
145 天前
@iorilu chrome 浏览器 -> 设置 -> 无障碍 -> 实时字幕 -> 自动为音频和视频创建字幕 选项打勾

下面下载并选择一种语言,此时打开一个视频网站比如 youtue ,它就会实时的识别音频,并弹窗显示识别出的字幕。

上面的代码就是调用它的动态库而已。代码在 linux 下测试正常。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1061061

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX