[Android] 困于 Gboard 孱弱的中文拼音词库,整理制作了一份一百万词汇量的词库

2020-11-01 15:57:57 +08:00
 haozi1986

首先回答一个肯定有人会问的问题

Q: 既然 Gboard 中文拼音输入这么弱,为什么不用 XX 输入法🙄:

A:因为不喜欢😏


⚠️为节约您的时间:


简介

一直以来都感觉 Gboard 的中文拼音输入词库过于奇葩,而网上的很多观点是这个词库需要自己养,自从谷歌砍了词库同步的功能(或许还存在但基本上我就没有一次成功),前几天碰巧更新一次系统忘记了备份,数据就全部丢失了,于是想自己创建一个词库,一劳永逸。

其实网络上相关的词库有很多,但 Gboard 在导入的时候动辄需要数分钟,经常性的无响应,最后还发现导入的数据不全,似乎是有条数限制,于是也只能从简化数据的方向入手,直到前些天无意间看见了这样一个 issues

(这个 issues 的发布者也提供了一个词库数据库,你也可以用他提供的词库)

尝试了一下,的确可行,于是开始整合自己手上的所有数据

当前词库共有 1,085,476 个词语,包含以下内容:

所有数据均已进行去重精简

因为暂不清楚 Gboard 自带的词汇范围,双方肯定存在大量重叠,如果后期找到相关数据,会进行进一步精简处理。


如何使用

前往 https://github.com/wuhgit/CustomPinyinDictionary/releases 下载压缩包。

下载后解压,得到 PersonalDictionary.db

releases 2020-11-01
PersonalDictionary.db
SHA1: FB0A45C087627DBD12D032E0B06359842F6291BE
MD5: 5B0CC9F85D942404F3608330C81608DE

将其复制到您手机这个目录中:

/data/data/com.google.android.inputmethod.latin/databases

如果你有用 Tasker ,可以将 PersonalDictionary.db 置于手机 Download 目录,再导入执行我提供的一个 Tasker 配置文件 即可。

由于是采用数据库替换的方式,您现有的个人词库将会被覆盖,请自行备份相关数据,数据位于:

/data/data/com.google.android.inputmethod.latin/databases/PersonalDictionary.db

在导入之前,请确保 Gboard 不是您手机上唯一的输入法,以免发送其它意外。

词库导入后,可能需要一点时间后才能在输入时感知到新词,期间 Gboard 可能会在通知栏以 正在改善您的打字输入体验 进行提示。

如果一切顺利,您可以在 Gboard 设置 > 字典 > 个人字典 > 中文(简体) 查看最终导入的数据。

好了,就这样,后续应该会有更新,也可能没有,随缘吧~

20926 次点击
所在节点    分享创造
69 条回复
francis59
2021-02-23 16:14:33 +08:00
网上看到的一个不用 root 的方法:下载搜狗细胞词库或者 PC 端搜狗输入法词库导出,然后用深蓝词库转换成 Gboard 格式再导入
https://sspai.com/post/56697
francis59
2021-02-23 16:17:34 +08:00
@francis59 文章是 19 年 9 月的
深蓝词库转换 20 年 7 月的 v2.9.0 已经增加对 GBoard 词库导入导出的支持
https://github.com/studyzy/imewlconverter/releases
sastar
2021-04-19 11:17:01 +08:00
看到楼主发的[深蓝词库的 issue]( https://github.com/studyzy/imewlconverter/issues/111)中最后提到,直接导入可能会出现点击个人词典闪退的问题(我出现这个问题了🤣),建议清除所有数据后,通过 dd if=PersonalDictionary.db of=/data/data/com.google.android.inputmethod.latin/databases/PersonalDictionary.db 命令导入,直接复制粘贴的话可能会出现以上问题。命令可以通过 termux 执行,或者直接通过楼主的 tasker
e1d4py0KiD6KgqkQ
2022-04-28 14:29:10 +08:00
手头就一台 LG V30+,原装安卓 9 ,不敢 root 也不敢 BL ,说是会删除所有数据,脑壳疼
e1d4py0KiD6KgqkQ
2022-04-28 20:15:53 +08:00
去你那 GitHub 上下载 dict 格式的词库,用深蓝 QQ 拼音转 Gboard ,结果也不行🙈🙈没招了
haozi1986
2022-04-29 08:24:07 +08:00
@xuxinglin8888

数据量太大了,要是 Gboard 可以直接导入这么多数据,我也不会这么折腾……不过现在已经换成通过 Magisk 模块来更新词库,比以前方便多了

解 BL 是会删除全部数据,我觉得如果有条件,先备份现有数据到其它地方,解锁完成后恢复也不是不能接受,这个就看个人的选择了
Weyeeep
2022-05-04 23:33:44 +08:00
已经刷入,正在体验,谢 up
zhangberry
2022-12-10 22:59:35 +08:00
为了装这个词库,专门刷了 root...
KomeijiKoishi
2023-08-04 01:21:31 +08:00
楼主直到上个月还坚持更新,这个词库真的太好用了,感谢楼主

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/720717

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX