双拼的邪路,致打算学习双拼的朋友

2022-11-06 16:35:48 +08:00
 2NUT
周末检索了下 输入法的方案。 有些思考。中文输入法无非 形码输入(按照汉字 字型编码,如仓颉、五笔、郑码、徐码等)、音码输入(按照汉字读音编码,如全拼、双拼、注音等)。



从文化角度说,虽然汉字拉丁化方案建国时已经大讨论过了,但本质上 按照 音表汉字还是违背了汉字表意的本质,丢失了中华文化的内涵。所以 音码输入是最广泛应用的汉字电脑输入方案,完美解决汉字输入问题的同时,其实略有遗憾。



从信息流的角度来说,音码无疑是最优的方案编码,如下音码天生少一个从读音到字形的 [转码] 环节。*减少大脑负担。因为汉语拼音(港台 w 注音)已经事先通过义务教育解决了音码编码问题,而且汉语拼音更是直接采用拉丁字母,天然适配键盘,连注音需要将注音符号映射到 26 个字母键盘按键地学习过程都不需要。无疑,音码方案,尤其是拼音输入方案可以说一点门槛没有。而形码需要重新学习 1. 字根背诵 2. 字根与 26 字母映射关系 3.拆字规则背诵、持续练习,这个过程可谓是学习曲线极其陡峭以至于早期需要由打字培训班这种事物。而且天生形码需要由音转形的过程,早期实践过程记不得字根、不熟练不会拆字、拆完了也卡顿才能找打对应按键,大脑负担极大。

形码: 思维--内语--音-->形---形码--> 按键-->选字-->上屏显示
音码: 思维--内语--音-->音码--> 按键-->选字-->上屏显示

那为什么五笔等形码输入熟练后比音码输入速度高呢,无非是伟大的人脑直接将内语到编码输出的环节一一映射了,不需要再显式地进行中间态编码转换,所以音码还是形码熟练后其实都是 直接从 内语到输出编码。当然 五笔因为编码详尽,重码低,在 按键-->选字-->上屏显示 上有一定优势。



抛开学习成本问题,再来看输入效率问题。

音码方案中,从输入效率角度说,全拼输入有两个缺陷,编码过长(全部汉字读音需要输入)、重码过高。 吸取 注音输入的优点,发展出了双拼输入法,但依然存在重码高的问题。这时候 [邪路] 出现了,双拼输入方案纷纷开始采用加形码的方式降低重码率,音形双修是为邪路! 这简直似乎倒行逆施,本身能够由机器通过词库匹配、甚至深度学习如 bert 模型预测的东西,直接加码让大脑去解决,可以说是技术架构路线选择失败的典型。音码方案中全拼输入法相比注音确实击键多了,双拼的出现是一个进步,而双拼音形的出现是个大退步。使用电脑的目的是解放人脑,没见过给大脑加担子的。这是典型的 [ XY 问题] :

X 问题: 拼音重码率多,我需要避免重码问题带来的增加击键次数增加和选择的成本
Y 解决方案: 我给你再增加码长,和新的编码规则,你去学吧,直接减少重码。
再问:其实我只需要减少重码下的击键次数呀...

这非常类似 张益唐 最近评价 西格尔零点问题的思路 [我一开始想解决这个问题,想找到西格尔零点这根针,搜遍了整个海底,最后我发现找不到这根针其实也能解决问题] 。音码方案未来一定会进一步通过程序框架本身解决重码选择的问题,而不是再增加学习成本和大脑负担去增加形码辅码。


玩笑:本人打算研发一款 HASH 输入法,均匀将 unicode 字符映射到 26 个字母;支持所有语言,码长不同语言不定,尽情期待
4120 次点击
所在节点   输入法
31 条回复
2NUT
2022-11-06 16:54:58 +08:00
但有思考,作为程序辅助判断减少选词的机制,是拐杖 但对于语言的自由性来说也是枷锁。 但作为输入法工程产品应该不思考这个层次的问题了。
2NUT
2022-11-06 16:55:46 +08:00
脱水版: 音形码方案是邪路,不值得。
infun
2022-11-06 16:59:01 +08:00
熟练之后 打字没有思考过程,直接肌肉记忆来输入的
mofe
2022-11-06 18:08:36 +08:00
几乎没人学双拼用形码吧
jarence
2022-11-06 18:39:50 +08:00
我八月开始尝试双拼的,现在用着感觉挺好。和三楼说的一样,现在是靠肌肉记忆输入。而且和英文输入不会有矛盾。但也有缺点:纠错功能几乎没有,对不分平翘舌前后鼻音的四川人来说增加了一点负担。
SuperMild
2022-11-06 18:47:30 +08:00
这个其实是大多数人的自然选择,双拼本来就是小众。
IvanLi127
2022-11-06 18:48:20 +08:00
@mofe 对不起,我在用小鹤音形。2 音 2 形🤣
mofe
2022-11-06 18:52:07 +08:00
@IvanLi127 我想做一个小调查,

用双拼不用形码的给我点个❤️
用双拼用形码的给楼上点个❤️
lekai63
2022-11-06 19:09:29 +08:00
用双拼 不用形码。
已点赞 @mofe
sheeta
2022-11-06 19:16:43 +08:00
@mofe 用形码主要的作用是一键上屏,不用选词,打完就上屏了
Vitta
2022-11-06 19:34:20 +08:00
😐我先用的小鹤音形再用的键道 6 ,全是音形码
Jooooooooo
2022-11-06 19:35:42 +08:00
双拼都是肌肉记忆. 打的少的音速度会慢很多.
clrss
2022-11-06 19:38:52 +08:00
15 年双拼用户, 不用形码.

问一下形码和普通双拼有冲突吗? 比如日常只用声码, 碰到半天没找着的字, 按快捷键进入形码状态一键上屏, 可以吗?
songer
2022-11-06 19:41:19 +08:00
全拼或者双拼打比较少用的字的时候,很依赖词组,打词组然后删掉一个。而音形可以准确打出单字,仅此而已,缺点就是只会读或者只会写的时候,卒

最开始选择音形是发现自己提笔忘字,本想着拆字时候可以回忆一下,结果熟练以后全是肌肉记忆,卒
ospider
2022-11-06 19:43:57 +08:00
把「敬请期待」写成「尽情期待」的人,应该汉语水平不高吧。
2NUT
2022-11-06 19:47:23 +08:00
@ospider #15 警察叔叔好,今天我真的没带钱,能下次给么
wu67
2022-11-06 20:05:50 +08:00
从文化角度, 自汉字简化推行那刻开始, 就把文化抛弃了, 象形音形字有些被砍得完全面目全非, 为了书写方便强行抛弃了

至于什么信息流, 其实双拼的上手难度和输入效率的折中, 使得综合水平完胜大部分输入, 输入法只是工具, 在足够轻松的情况下提升效率即使王道, 无脑增加学习难度只为提高输入效率才叫邪道(五笔)

至于重码加形啥的...我宁愿敲词组删一个...
sinxccc
2022-11-06 21:21:17 +08:00
@wu67 这个锅得从隶变开始,简体字不背…
sinxccc
2022-11-06 21:30:58 +08:00
形码的话,字根的抽象是一层额外的生造。只要是形码,不管标榜自己有多科学多自然,学习者始终躲不过背诵字根和拆字规则这一步。而且各家的抽象多少都有缺陷,五笔的无理码、仓颉的砍笔画和过冗长的编码、郑码的倒数第二码和强笔顺依赖,这也是各个方案的拥护者从古吵到今的源头…

但历史事实就是能活到现在的形码,不管哪个都摆脱不了字根这一层,不知道还有没可能存在其他的方案。
luomu24
2022-11-06 21:54:16 +08:00
一直有个疑问,我五笔从初高中起打了快十年,但是越打越忘,不知道是不是正常的。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/893088

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX