大家是如何扩充鼠须管输入法的词库的?

2015-03-19 13:22:19 +08:00
 anguslg
目前在用鼠须管输入法,各方面配置已经最贴近自己使用习惯了,唯一的不足是词库缺乏。


之前使用的是搜狗,积累了不少个人词库,这些词库目前也都已经导入到了鼠须管词库,但是相比不断增长的新词,仍然感到力不从心手动输入肯定不现实,不知道各位是怎么积累词库的?
5963 次点击
所在节点    macOS
28 条回复
zhouzm
2015-03-19 20:27:26 +08:00
不需要考虑解密的问题,只要判定某个md5或sha256达到热词标准,加入云端可上传列表,哪个用户优先更新到这个sha256,同时本机又存在这个热词,自动上传即可,当然也可以设一个开关,让用户决定上不上传。
shyangs
2015-03-20 01:07:26 +08:00
@lotem
讚數 方法有漏洞。

要識別 100不同使用者,避免刷讚分,那每個使用者都要有獨立的ID. 因為如果沒有獨立ID的話,我愛刷幾個讚就直接定一個大數字發佈就是。如果ID是隨機生成 而非計算硬體資訊綁定的話,我就一直安裝反安裝刷隨機ID.

既然有固定ID,這樣我就加入這個P2P網路,每天就在網路中收集 己解密的新詞、未解密的新詞hash、和使用者id.

過一天,收集到新的解密的新詞,計算新詞的hash, 對比前一天和hash綁定的使用者id, 那我不就知道這新詞哪些使用者id會打。

--------

而 Daniel65536 與運算、或運算的算法,可以不記錄使用者id,但也無法防禦惡意spam.
dearrrfish
2015-03-20 02:30:47 +08:00
@shyangs
与硬件绑定的UID如何进行配置云同步?
shyangs
2015-03-20 11:39:44 +08:00
@lotem
Rime 的用戶數就有雲詞庫,也會被吐槽不如搜狗好用吧。

應該加強靈活性、配置性 這些 Rime 的固有強項,比如提供插件系統。讓第三方開發者編寫插件。

比如,羨慕搜狗/百度/QQ的詞庫,就編寫插件,插件每天連網下載,下載完自動編譯固態詞典,掛到指定的方案上。
也不是只能連輸入法大廠,插件開發者也可以架一個Server,寫爬蟲每天爬微博熱搜榜,讓插件連這個Server下載新的微博熱詞,自動編譯自動掛載。
Rime 官方想提供雲詞庫,一樣可以透過插件。有人不想上傳的詞彙(比如:自己和朋友的姓名),可以直接修改插件,弄一個黑名單。

為降低插件編寫門檻,可以考慮編寫語言使用流行廣的腳本語言。
lotem
2015-03-20 12:16:21 +08:00
@shyangs 事實上,我有一個寫了一半的項目 lotem/rimekit ,是一個分發 Rime 配置的工具,把輸入方案、配色方案、各項設定用 JavaScript/Coffeescript 腳本寫成「配方」,在 rimekit 裏列表顯示,用戶勾選即可完成配置。這功能不需要在輸入過程中即時調用,所以不必做成插件,以保持輸入法本身簡單可靠。
anguslg
2015-03-20 17:35:11 +08:00
@lotem 不知道搜狗的这个对词库有没有帮助
http://www.sogou.com/labs/dl/w.html
jprovim
2015-03-23 04:47:25 +08:00
@lotem

直接開一個github repo每週更新詞組, 需要的直接下載詞庫即可.
不用支持自動update, 不然就跟其他的輸入法沒有區別了.
leopku
2018-11-21 22:06:58 +08:00
🂡🂢🂣

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/177979

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX