求有空的程序员朋友写一个五笔编码查询与编辑软件

2018-09-18 00:29:09 +08:00
 v2register
先说一下:无偿,请不要喷我。

我在做新世纪版五笔字型超大字符集编码,9 月底应该能完成 Unicode 11.0.0 全部 CJK 字符的初校。目前用的是文本编辑器来弄,7.17 项目开始,已持续 2 个月了,过程相当枯燥、苦逼...

项目地址: https://github.com/CNMan/UnicodeCJK-WuBi06

最近在想,如果把前辈们已经搞完的 86 版、98 版编码放在一起,互相借鉴、印证,该是多好的的一件事。但我不会编程,才来求助各位。

软件的需求大致如下:



数据源: https://github.com/CNMan/UnicodeCJK-WuBi

数据源 txt 编码:UTF-8

数据源 txt 格式:

第一列:Unicode 编码
第二列:Unicode 字符
第三列:86 版五笔字型编码
第四列:98 版五笔字型编码(目前缺 CJK-F )
第五列:06 版五笔字型编码(暂无数据)(月底完成初校后会补上)
第六列:笔顺(暂无数据)(月底会补上)

数据库最好直接采用 txt 文本(或 csv 文本),如果不行,可以转为其他数据库格式

字形展示:

不依赖系统字体,采用 BabelMap 导出的字体图片,文件名格式统一为 U_xxxxxx.png ( xxxxxx 为 6 位 Unicode 编码,不足 6 位则前面补 0 ),按平面分文件夹存放

字形图片展示 1:中华书局宋体(存放路径 FontGlyphs\ZhongHuaSong\Plane00\...Plane02\)

字形图片展示 2:中易宋体(存放路径 FontGlyphs\SimSun\Plane00\...Plane02\)

用两种不同字体可以防止出现个别字形错误导致编码错误,可以只支持两种字体,也可以支持自定义字体路径

查询框:支持 Unicode 编码查询和字符查询即可

修改按钮:按下后变为“保存按钮”,也可以分开

最好能将结果直接保存到 txt 或 csv 文件中,如果不行,应可以由某种数据库格式转换为原始的 txt/csv 编码和格式。

多谢!
4990 次点击
所在节点    程序员
48 条回复
xxgirl2
2018-09-18 11:16:53 +08:00
@openbsd 这贴不是推行,根据 12L 我也明白了 LZ 的主要目标用户应该是码表作者、古籍录入人员等。

形码有这样几个优点:
1. 精准定位,单字输入时八成以上直接空格上屏,少部分需要数字键,极少部分选字要翻页
2. 根据 1 可得,完全断网不影响输入效率
3. 根据 2 可得,多平台之间输入区别不大
4. 根据 1 可得,隐私友好(开源友好?)
但是第 1 点显然也针对文字工作者,如果每天输入量不上万,这个优势不明显 :(
上面说的是形码的特点。那么选择形码的时候也要考虑,如果输入简体字,跨平台方案里五笔 86 最流行,有些公用机也装有五笔 86,方便使用。

我因为需要大量打字使用过双拼,现在使用五笔,但我从来不推荐一般人使用五笔,我平时会推荐双拼 :)
g00001
2018-09-18 11:26:09 +08:00
用的人少并不等于就一定要被淘汰,
拼音无法完全避免大量的重码,打一些常用的、幼稚的聊天句子是挺快的,专业生僻一点的文章就不行了。也不需要专业生僻,有时候需要打几个单字用拼音都会捉急,重码太多了,任何东西都不是十全十美的,拼音输入法也一样,没有一个东西能解决所有问题,所以自己不用,还是要给别人选择的权利嘛。
xxgirl2
2018-09-18 11:26:55 +08:00
@v2register 歪个楼。之前观察 F 区文字时候有那么几个实在是诡异,也是辛苦了码表作者 :(
fumichael
2018-09-18 11:34:41 +08:00
我用的还是 86 版的五笔编码,感谢楼主的贡献
v2register
2018-09-18 11:36:37 +08:00
@xxgirl2 我是以 86 版为蓝本开始新世纪编码的,编码差异大约 30%~ 40%,他的字体用的是增补的“海峰超大字符集字体包”,除了 CJK-F 完全错误以外,前面的几区也有个别字符顺序错乱的问题
xxgirl2
2018-09-18 11:47:51 +08:00
@v2register hmmm,字体的话可以考虑花园明朝,出的速度快。unicode 官方 pdf 里也列出了他们用的字体,其中就有花园。
openbsd
2018-09-18 11:50:45 +08:00
@g00001 #22 我也觉得奇怪,我认识的所有(注意是所有)五笔使用者,都需要使用 五笔拼音混输 才能完成文字录入,但是拼音使用者中,没有这样的需求,那五笔存在的意义是 ?我觉得将它升级为“专业文字输入工具”会不会更好 ?别忘了,还有郑码啥的......
tourist2018
2018-09-18 16:27:28 +08:00
记得我上中学的时候还专门有同学去培训班里面学五笔的,那时候觉得好牛逼,当时输入联想啥的完全达不到现在的水平


现在他估计都把这项技能丢了
g00001
2018-09-18 16:58:44 +08:00
那说明使用五笔的同样会拼音输入法,拼音输入法一般智商都不能学好。
但是有些人会优先使用五笔,五笔按键的速度很快,能有这样的机会近距离观察别人是不是混输的机会应当不多,估计“你认识的所有(注意是所有)五笔使用者”应当数量有限, 而且你认识的这些人都是“专业文字输入”工作吗?!

打个比方,人家有钱买了飞机,一会开飞机一会 “混用” 别的交通工具,而没有飞机的就没有这种“混用”的需求,不能推断出“飞机”应该被淘汰,当然,会开飞机的肯定是少数。
weixiangzhe
2018-09-18 18:36:11 +08:00
新世纪五笔用户表示强烈支持
v2register
2018-09-18 18:41:55 +08:00
fayloue
2018-09-18 19:02:54 +08:00
新世纪用户很少吧。
fayloue
2018-09-18 19:10:48 +08:00
这应该能反映出五笔的好处吧。http://tieba.baidu.com/p/5646892516
allenhu
2018-09-18 19:30:22 +08:00
5 年老用户五笔已经放弃,终究要淘汰的东西,别浪费时间了。既不科学,也不高效。
panda
2018-09-18 20:37:43 +08:00
@allenhu 怎么会淘汰啊,我就不会拼音只会五笔,不出奇。
missdeer
2018-09-18 21:20:59 +08:00
@openbsd 你的样本空间不够大。十几年五笔老用户表示平均一年顶多能遇到一次要用拼音的情况。五笔绝大多数时候可以盲打(不需要看候选列表),就算只是用于网上聊天我也觉得这样比拼音每个输入都要看一眼候选列表的好,眼珠(视线)的跳动,注意力的跳转都是影响输入心情(非专业文字录入人员不怎么特别关注输入效率)的事。
xuanbg
2018-09-18 21:31:03 +08:00
@openbsd 当初是因为拼音输入法输入速度太慢的缘故,所以有各种输入法,都是为了同一个目的,就是提高汉字的输入速度。

至于当年的拼音输入法如何慢,想体验的可以装个 xp,用自带的全拼输入法感受一下。
likuku
2018-09-18 21:31:35 +08:00
当有强大 AI 加持的高级 OCR 可以超越普通人类准确率识别随机人类手写字体难看的汉字文本(鬼画符)时(实用成本极低时),五笔输入法这种型码输入法或许才有淘汰的理由。
nosay
2018-09-18 21:34:12 +08:00
五笔现在优势确实是减弱了,但是我依然找不到换回拼音的理由。
likuku
2018-09-18 21:34:54 +08:00
@xuanbg xp 的全拼 /微软拼音输入法 还算不错了,很早支持 GBK/GB18030,至少生僻汉字覆盖比较全面。那时很流行的 win 自带“智能 ABC ”(一直认为它很智障),受限于 GB2032,容易遇到无法输入生僻字…

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/490269

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX